风险提示:理性看待区块链,提高风险意识!
读取、索引到分析 简述Web3数据索引赛道
首页 > 业界 > Web3 2024-09-17 17:30
摘要
2024 年,热点聚焦于 AI 与 Web3,在人工智能的世界里,数据就像是其成长与进化的生命源泉 。
币界网报道:

1 引言

从 2017 年的第一波 dApp Etheroll、ETHLend 与 CryptoKitties 开始,到如今各式各样基于不同区块链的金融、游戏与社交 dApp 百花齐放,当我们谈论去中心化的链上应用时,是否曾思考过这些 dApp 在交互中所采纳的各类数据的源头?

2024 年,热点聚焦于 AI 与 Web3,在人工智能的世界里,数据就像是其成长与进化的生命源泉。正如植物依赖阳光和水分才能茁壮成长,AI 系统同样依赖海量的数据来不断「学习」和「思考」。没有数据,AI 的算法再精妙也不过是空中楼阁,无法发挥其应有的智能与效能。

本文从区块链数据可访问性(Data Accessibility)的角度,深入分析了行业发展过程中区块链数据索引的演变,并对比了老牌数据索引协议 The Graph 与新兴的区块链数据服务协议 Chainbase 和 Space and Time,特别探讨了这两个结合 AI 技术的新晋协议在数据服务与产品架构特色的异同。

2 数据索引的繁与简:从区块链节点到全链数据库

2.1 数据源头:区块链节点

从一开始了解「区块链是什么」时,我们就常看到这样一句话:区块链是去中心化的记账本。区块链节点是整个区块链网络的基础,承担着记录、存储和传播链上所有交易数据的责任。每个节点都拥有一份完整的区块链数据副本,确保网络的去中心化特性得以维持。然而,对于普通用户来说,自建和维护一个区块链节点并非易事。这不仅需要专业的技术能力,还伴随着高昂的硬件和带宽成本。同时,普通的节点查询能力也有限,无法以开发人员需要的格式查询数据。因此,尽管理论上每个人都可以运行自己的节点,但实际操作中,用户通常更倾向于依赖第三方服务。

为了解决这一问题,RPC(远程过程调用)节点提供商应运而生。这些提供商负责节点的成本和管理,并通过 RPC 端点提供数据。使得用户可以无需自建节点,便可轻松访问区块链数据。公共 RPC 端点是免费的,但有速率限制,可能会对 dApp 的用户体验产生负面影响。私有 RPC 端点通过减少拥塞提供更好的性能,但即使是简单的数据检索也需要大量的来回通信。这使得它们请求繁重,对于复杂的数据查询效率低下。此外,私有 RPC 端点通常难以扩展,并且缺乏跨不同网络的兼容性。但节点提供商标准化的 API 接口给予了用户访问链上的数据更低的门槛,为后续的数据解析和应用打下了基础。

2.2 数据解析:从原型数据到可用数据

从区块链节点获取的数据往往是经过加密和编码处理的原始数据。这些数据虽然保留了区块链的完整性和安全性,但其复杂性也增加了数据解析的难度。对于普通用户或者开发者来说,直接处理这些原型数据需要大量的技术知识和计算资源。

数据解析的过程在这一背景下显得尤为重要。通过将复杂的原型数据进行解析,转换为更易理解和操作的格式,用户可以更直观地理解和利用这些数据。数据解析的成功与否直接决定了区块链数据应用的效率和效果,是整个数据索引流程中的关键一步。

2.3 数据索引器的演进

随着区块链数据量的增加,数据索引器的需求也日益增加。索引器在组织链上数据并将其发送到数据库以便于查询方面起着至关重要的作用。索引器的工作原理是索引区块链数据并通过类似于 SQL 的查询语言(GraphQL 等 API)使其随时可用。通过提供查询数据的统一界面,索引器允许开发人员使用标准化查询语言快速准确地检索所需的信息,从而大大简化了流程。

不同类型的索引器通过各种方式优化数据检索:

  1. 完整节点索引器:这些索引器运行完整的区块链节点并直接从中提取数据,确保数据完整准确,但需要大量的存储和处理能力。

  2. 轻量级索引器:这些索引器依靠完整节点根据需要获取特定数据,从而减少存储要求但可能会增加查询时间。

  3. 专用索引器:这些索引器专门针对某些类型的数据或特定的区块链,可优化特定用例的检索,例如 NFT 数据或 DeFi 交易。

  4. 聚合索引器:这些索引器从多个区块链和来源提取数据,包括链下信息,提供统一的查询界面,这对于多链 dApp 特别有用。

目前,以太坊档案节点(Archive Node)在 Geth 客户端中的存档模式占用了约 13.5 TB 的存储空间,而在 Erigon 客户端下,存档需求约为 3 TB。随着区块链的不断增长,档案节点的数据存储量也会随之增加。面对如此庞大的数据量,主流索引器协议不仅支持多链索引,还针对不同应用的数据需求,定制了数据解析框架。例如,The Graph 的「子图」(Subgraph)框架就是一个典型案例。

索引器的出现大大提升了数据的索引和查询效率。与传统的 RPC 端点相比,索引器可以高效地索引大量数据,并支持高速查询。这些索引器允许用户执行复杂的查询,轻松过滤数据,并在提取后进行分析。此外,一些索引器还支持聚合来自多个区块链的数据源,避免在多链 dApp 中需要部署多个 API 的问题。通过在多个节点上分布式运行,索引器不仅提供了更强的安全性和性能,也减少了集中式 RPC 提供商可能带来的中断和停机风险。

相比之下,索引器通过预先定义的查询语言,使得用户可以在无需处理底层复杂数据的情况下,直接获取所需信息。这种机制显著提高了数据检索的效率和可靠性,是区块链数据访问的重要创新。

2.4 全链数据库:向流优先对齐

使用索引节点查询数据通常意味着 API 成为消化链上数据唯一门户。然而,当一个项目进入扩展阶段时,往往需要更灵活的数据源, 而这是标准化的 API 无法提供的。随着应用需求的复杂化,初级数据索引器与其标准化的索引格式逐渐难以满足越来越多样化的查询需求,例如搜索、跨链访问或链下数据映射。

读取,索引到分析,简述Web3数据索引赛道

在现代数据管道架构中,「流优先」方法已经成为解决传统批处理局限性的一种方案,能够实现实时的数据摄取、处理和分析。这种范式的转变使得组织能够对传入数据立即作出响应,从而几乎即时地得出洞察并做出决策。类似地,区块链数据服务提供商的发展也正朝着构建区块链数据流的方向前进,传统索引器服务商均陆续推出了以数据流方式获取实时区块链数据的产品,例如 The Graph 的 Substreams,Goldsky 的 Mirror,也有如 Chainbase 和 SubSquid 这样根据区块链生成数据流的实时数据湖。

这些服务旨在解决对区块链交易进行实时解析和提供更全面查询能力的需求。正如「流优先」架构通过降低延迟和增强响应能力,革新了传统数据管道中的数据处理和消费方式一样,这些区块链数据流服务商也希望通过更先进且成熟的数据源,支持更多应用程序的发展并辅助链上数据分析。

通过现代数据管道的视角重新定义链上数据的挑战,我们得以从全新的角度看待链上数据的管理、存储和提供的全部潜力。当我们开始将子图和以太坊 ETL 等索引器视为数据管道中的数据流而非最终输出时,便可以设想一个能够为任何业务用例量身定制高性能数据集的可能世界。

3 AI + Database? 深入对比 The Graph, Chainbase, Space and Time

3.1 The Graph

The Graph 网络通过一个去中心化的节点网络来实现多链数据索引和查询服务,促进开发者便捷地索引区块链数据并构建去中心化应用。其主要的产品模式为数据查询执行市场和数据索引缓存的市场,这两个市场本质都是服务于用户的产品查询需求,其中数据查询执行市场具体指消费者为所需的数据选择合适的提供数据的索引节点付费,数据索引缓存的市场则是索引节点依据子图的历史索引热度、收取的查询费、链上策展人对子图输出的需求调动资源分配的市场。

子图(Subgraphs)是 The Graph 网络中的基础数据结构。它们定义了如何从区块链中提取并转换数据为可查询的格式(例如 GraphQL 模式)。任何人都可以创建子图,且多个应用可以重复使用这些子图,这提升了数据可复用性和使用效率。

读取,索引到分析,简述Web3数据索引赛道

The Graph 产品结构 (Source: The Graph Whitepaper)

The Graph 网络由四个关键角色构成:索引器、策展人、委托人和开发者,他们共同为 web3 应用提供数据支持。以下是他们各自的职责:

  • 索引器(Indexer):索引器是 The Graph 网络中的节点运营商,索引节通过质押 GRT(The Graph 的原生代币)参与网络,提供索引和查询处理服务。

  • 委托者(Delegator):委托者是那些将 GRT 代币质押给索引节点以支持其运营的用户。委托者通过他们所委托的索引节点赚取部分奖励。

  • 策展人(Curator):策展人负责信号哪些子图应该被网络索引。策展人帮助确保有价值的子图被优先处理。

  • 开发者(Developer):与前三者作为供应方不同,开发者是需求方,是 The Graph 的主要用户。他们创建并提交子图至 The Graph 网络,等待网络满足需求数据。

读取,索引到分析,简述Web3数据索引赛道

目前 The Graph 已经转向全面的去中心化子图托管服务,不同的参与方之间有流通的经济激励确保系统运转:

  • 索引节点奖励:索引节点通过消费者的查询费用和部分 GRT 代币区块奖励来赚取收益。

  • 委托者奖励:委托者通过他们所支持的索引节点获得部分奖励。

  • 策展人奖励:如果策展人信号了有价值的子图,他们可以从查询费用中获得部分奖励。

事实上,The Graph 的产品也在 AI 浪潮中迅速发展。作为 The Graph 生态系统的核心开发团队之一,Semiotic Labs 一直致力于利用 AI 技术优化索引定价和用户查询体验。当前,Semiotic Labs 开发的 AutoAgora、Allocation Optimizer 和 AgentC 工具分别在多个方面提升了生态系统的性能。

  • AutoAgora 引入动态定价机制,基于查询量和资源使用情况实时调整价格,优化定价策略,确保索引器的竞争力和收入最大化。

  • Allocation Optimizer 解决了子图资源分配的复杂问题,帮助索引器实现资源的最佳配置,以提升收入和性能。

  • AgentC 是一个实验性工具,允许用户通过自然语言访问 The Graph 的区块链数据,从而提升用户体验。

这些工具的应用使得 The Graph 结合 AI 辅助进一步提升了系统的智能化和用户友好度。

3.2 Chainbase

Chainbase 是一个全链数据网络,将所有区块链数据整合到一个平台,方便开发者更轻松地构建和维护应用程序。它的独特功能包括:

  • 实时数据湖:Chainbase 提供了一个专门用于区块链数据流的实时数据湖,使得数据在生成时即可被即时访问。

  • 双链架构:Chainbase 基于 Eigenlayer AVS 构建了一个执行层,与 CometBFT 的共识算法形成并行的双链架构。这种设计增强了跨链数据的可编程性和可组合性,支持高吞吐量、低延迟和最终性,并通过双重质押模型提升了网络安全性。

  • 创新数据格式标准:Chainbase 引入了一种名为「manuscripts」的全新数据格式标准,优化了加密行业中数据的结构化和利用方式。

  • 加密世界模型:凭借其庞大的区块链数据资源,Chainbase 结合 AI 模型技术,打造了能够有效理解、预测区块链交易并与之交互的 AI 模型。目前已推出基础版模型 Theia,供公众使用。

读取,索引到分析,简述Web3数据索引赛道

这些功能使 Chainbase 在区块链索引协议中脱颖而出,尤其注重实时数据的可访问性、创新的数据格式,以及通过链上和链下数据的结合,创建更智能的模型以提升洞察力。

Chainbase 的 AI 模型 Theia 是其区别于其他数据服务协议的关键亮点。Theia 基于 NVIDIA 开发的 DORA 模型,结合链上和链下数据以及时空活动,学习并分析加密模式,并通过因果推理做出响应,从而深入挖掘链上数据的潜在价值和规律,为用户提供更加智能化的数据服务。

AI 赋能的数据服务使 Chainbase 不再仅仅是一个区块链数据服务平台,而成为一个更具竞争力的智能化数据服务商。通过强大的数据资源和 AI 的主动分析,Chainbase 能够提供更广泛的数据洞察,并优化用户的数据处理过程。

3.3 Space and Time

Space and Time (SxT) 意在打造可验证的计算层,在去中心化数据仓库上扩展零知识证明,从而为智能合约、大语言模型和企业提供可信的数据处理。目前 Space and Time 已获得 2000 万美元最新一轮的 A 轮融资,由 Framework Ventures、Lightspeed Faction、Arrington Capital 和 Hivemind Capital 领投。

在数据索引和验证领域,Space and Time 引入了一种全新的技术路径——Proof of SQL。这是 Space and Time 开发的一种创新零知识证明(ZKP)技术,确保在去中心化数据仓库上执行的 SQL 查询是防篡改的和可验证的。当运行查询时,Proof of SQL 会生成一个加密证明,验证查询结果的完整性和准确性。这个证明附加在查询结果上,使任何验证者(如智能合约等)都可以独立确认数据在处理过程中未被篡改。传统的区块链网络通常依赖共识机制来验证数据的真实性,而 Space and Time 的 Proof of SQL 实现了一种更为高效的数据验证方式。具体来说,在 Space and Time 的系统中,一个节点负责数据的获取,而其他节点则通过 zk 技术验证该数据的真实性。这种方式改变了共识机制下多个节点重复索引相同数据的到最终达成共识获取数据的资源损耗,提升了系统的整体性能。随着这项技术的成熟,它为着重数据可靠性的一系列传统行业使用区块链上数据构造产品打造了落脚石。

读取,索引到分析,简述Web3数据索引赛道

同时,SxT 一直与微软 AI 联合创新实验室密切合作,加速研发生成式 AI 工具,方便用户更轻松地通过自然语言处理区块链数据。目前在 Space and Time Studio 中,用户可以体验输入自然语言查询,而 AI 会自动将其转换为 SQL 并代表用户执行查询语句呈现用户需要的最终结果。

3.4 差异对比

读取,索引到分析,简述Web3数据索引赛道

结论与展望

综上所述,区块链数据索引技术从最初的节点数据源头,经过数据解析和索引器的发展,最终演进到 AI 赋能的全链数据服务,经历了一个逐步完善的过程。这些技术的不断演进,不仅提高了数据访问的效率和准确性,还为用户带来了前所未有的智能化体验。

展望未来,随着 AI 技术和零知识证明等新技术的不断发展,区块链数据服务将进一步智能化和安全化。我们有理由相信,区块链数据服务将在未来作为基础设施继续发挥重要作用,为行业的进步和创新提供有力支持。

发表评论
发表评论
暂无评论
    相关阅读
    币界百科
    币界资讯
    卡尔达诺(ADA)的价格已逐渐预示着中期和宏观看涨前景。这款大型山寨币的完全稀释估值约为 369 亿美元,在过去七年里上涨了 12%……
    区块链
    2025-08-11 17:51:02
    XRP 期货交易领域正在经历有趣的发展,市场分析师 Cas Abbé 分享了如何利用这一趋势。
    区块链
    2025-08-11 14:53:44
    此评论是在最新一轮市场上涨的背景下发表的,该上涨推动 XRP 在一周内突破 3 美元的心理关口,创下年度新高。
    区块链
    2025-08-11 13:52:04
    在周二通胀数据公布之前,投机性仓位和宏观利好因素正在推动比特币上涨。但它能走多远?
    比特币
    2025-08-11 10:53:07
    本文围绕稳定币的货币属性展开探讨,并结合现代货币经济学理论进行分析与论证。
    区块链
    2025-08-11 10:30:50
    在加密货币的世界里,RVN交易和pDOTn交易平台正成为热门话题。RVN币是Ravencoin区块链网络的原生代币,致力于打造公平且去中心化的数字资产交易平台。它基于比特币代码库开发,采用X16R挖矿算法,有更快的交易确认速度和高吞吐量。其生态布局广泛,支持多种资产的token化发行与NFT市场构建。而pDOTn交易平台,虽未详细介绍,但在加密货币交易领域,它与RVN交易的结合或许能为投资者带来新的机遇。DYOR,深入了解它们,才能更好地参与加密货币的浪潮。
    区块链书籍
    2025-03-07 14:57:20
    近期,MUSK币价格异动引发全球投资者关注。2025年3月,MUSKIT代币24小时内暴涨240%。MUSK币价格在过去一周大幅波动,起初稳定,后快速上涨超30%,随后有所回落但仍处较高水平。其回调可能性较难判断,短期波动可能受大型交易平台操作、大户买卖影响;若为长期趋势开端,则与项目发展、宏观经济、加密市场整体趋势等有关,需持续观察。
    交易所百科
    2025-03-07 12:01:49
    进入2025年,加密货币市场不确定性加剧,Meme币领域却异军突起。自比特币减半后,加密市场走势低迷,但Meme币板块涨势明显,类别市值已突破570亿美元,日内涨幅达9.3%。其中,特朗普概念币TRUMP持续上涨,已突破10美元,24小时涨幅达29.7%。此外,狗狗币、佩佩币和柴犬币等也展示了显著的市场表现。不过,Meme币通常缺少真实价值和实际效用,价格易受投机、市场情绪和突发新闻事件影响。此前特朗普Meme币TRUMP火爆,但价格上涨过快,泡沫风险高,且未来锁仓代币释放或致价格回调。自Trump币热潮后,不少名人币热度褪去便快速回调。在市场情绪复杂、多空比变化等因素影响下,Meme币的回调可能性值得投资者高度关注。投资者需保持理性,谨慎决策,切勿盲目追涨。
    区块链百科
    2025-03-07 22:01:52
    在加密货币的投资浪潮中,GTCo永续合约与MOCA交易所成为众多投资者关注的焦点。GTCo永续合约作为一种无固定到期日的衍生品合约,价格与标的资产紧密相关,为投资者提供了灵活的交易选择。而MOCA交易所则是一个专业的交易平台,致力于为用户打造高效、便捷的交易环境。本文将深入剖析GTCo永续合约的特点与优势,同时详细介绍MOCA交易所的功能与服务,帮助投资者更好地了解这两者,把握投资新机遇。无论你是经验丰富的投资者,还是初入加密货币领域的新手,都能从本文中获取有价值的信息,提升自己的投资决策能力。
    交易所百科
    2025-03-07 09:45:37
    近期莱特币市场波动引发关注。据币界网消息,莱特币价格出现一定涨幅,如在3月3日价格达118.58美元/枚,日内涨幅3.01% ,交易量为20.76亿;2月22日价格突破128.41美元/枚,日内涨3.01% ,交易量21.6亿。不过,从k线图分析,莱特币处于下降趋势。价格和交易量的变化情况复杂,有时价格下降但交易量上升,表明抛售压力加大;有时价格和交易量同时下降,意味着市场活跃度降低。威廉指标显示其有时处于无超买超卖状态,有时处于超卖状态。市场上涨原因不明,建议投资者继续观望,等待明确信号。此前,莱特币也有过暴涨经历,如2021年9月13日21时35分 - 55分,受沃尔玛将开放莱特币付款消息影响,莱特币由176.9美元暴涨至235.46美元,涨幅达33.1% 。
    数字货币百科
    2025-03-08 10:46:33
    据说现在BTC已经处于超卖状态。目前是市场的超卖时间。
    比特币新闻
    2025-03-23 15:31:19
    MUSK币作为一个新兴的加密货币项目,目前在市场上备受关注。截至2025年3月2日22:33:25,MUSK币价格为¥ 0.0010,约$0.00014,24小时涨幅0.93%。其总市值为¥0.00 ,24H最高¥0.0010 ,24H最低价¥0.00100 ,24H成交量63.74万,24H成交额¥661.53 ,24H换手率1.85%。MUSK币目前还处于起步阶段,发行总量为10亿枚,但流通数量暂时为零,项目可能还在初期开发或筹备阶段。尽管如此,其旨在打造去中心化金融生态系统的目标明确,未来发展值得期
    区块链知识
    2025-03-03 20:02:17
    Santiment 表示,如果你支持价值 10 万美元的比特币,“那么比特币的主要利益相关者大多正朝着正确的方向前进”。
    比特币新闻
    2025-05-07 15:31:20
    今日艾达币市场表现备受关注,不同时段呈现出多样的走势。据最新消息,艾达币价格出现不同程度的日内涨幅,如曾达0.9955美元/枚,日内涨幅2.01%;也有价格达1.0377美元/枚,日内涨幅2.49%等情况。价格与交易量的关系复杂多变,有时价格上升但交易量下降,显示市场上涨动能减弱;有时价格和交易量同步上升,表明市场买盘强劲。投资者需警惕高位回落风险,关注交易量能否跟上价格上涨,以及是否有新的买盘出现,还应留意关键阻力位的突破情况,从而更好地把握市场动态。
    钱包知识
    2025-03-03 21:50:38
    在加密货币领域,新的交易模式和平台不断涌现,ANYONE杠杆和ASTR交易所成为了备受关注的焦点。ANYONE杠杆为投资者提供了独特的交易体验,让市场的波动有了更多的操作空间。而ASTR交易所作为一个具有潜力的交易平台,其背后的ASTR币凭借区块链的全球互联特性,在跨境支付与汇兑、供应链金融等领域有着重要应用。ASTR币不仅是Astar网络的实用代币,还支持多重签名等安全功能,为投资者的资产安全保驾护航。同时,Astar Network的创新功能也为开发者提供了更多的激励和选择。深入了解ANYONE杠杆与
    币种知识
    2025-03-03 19:38:33
    推荐专栏
    Boss Wallet Web3 Econom Pass
    Fully On-Chain & AI-Powered Meme Trading | #Xbit #DEX #Web3 | English: @XBITDEX | Chinese 华语 : @XBITDEX_ZH | Support: @XbitHelpDesk
    一位相信价值投资的币圈KOL。稳定盈利的缠论野生交易员 #BTC行情分析师 #价值投资 #链上数据分析
    爱Web 3,爱生活,爱科技,爱炒币的老韭菜
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    121,357.01 USDT
    ¥883,479.03
    +2.83%
    ETH以太坊
    4,252.99 USDT
    ¥30,961.77
    +1.3%
    XRP瑞波币
    3.28 USDT
    ¥23.85
    +2.71%
    USDT泰达币
    0.99940 USDT
    ¥7.18
    +0.16%
    BNB币安币
    808.94 USDT
    ¥5,810.93
    +0.76%
    SOL
    182.84 USDT
    ¥1,331.08
    +1.88%
    USDC
    0.99990 USDT
    ¥7.18
    +0.03%
    DOGE狗狗币
    0.23402 USDT
    ¥1.70
    +1.1%
    TRX波场币
    0.34070 USDT
    ¥2.45
    +0.12%
    ADA艾达币
    0.81060 USDT
    ¥5.82
    +1.9%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    Conflux
    0.2031 USDT
    ¥1.48
    -3.19%
    比特币
    121,357.01 USDT
    ¥883,479.03
    +2.83%
    以太坊
    4,252.99 USDT
    ¥30,961.77
    +1.3%
    Filecoin
    2.5873 USDT
    ¥18.84
    +0.13%
    柚子
    0.5337 USDT
    ¥3.89
    +0.36%
    狗狗币
    0.23402 USDT
    ¥1.70
    +1.1%
    以太经典
    23.05 USDT
    ¥167.80
    +0.61%
    火币积分
    0.179 USDT
    ¥1.30
    -1.16%
    Uniswap
    10.9937 USDT
    ¥80.03
    +3.27%
    Shiba Inu
    1.341E-5 USDT
    ¥0.00
    +0.07%
    Solana
    182.84 USDT
    ¥1,331.08
    +1.88%
    ChainLink
    21.6529 USDT
    ¥157.63
    -1.26%
    最新快讯
    更多
    Gate 将上线 SLAY 永续合约交易
    2025-08-11 18:10:38
    Cango Inc. 以 1950 万美元现金收购佐治亚州 50 兆瓦比特币挖矿设施
    2025-08-11 18:10:36
    dYdX 基金会筹集 800 万美元推动新一轮资助计划
    2025-08-11 18:07:03
    PlanB:标普500指数若达7000点,比特币价格或对应30万美元
    2025-08-11 18:00:50
    MGBX 将上线 AI16Z、NEAR、VET、RENDER现货交易
    2025-08-11 17:51:15
    Bitget 推出 VIP 专属晋升活动,总奖池 5.00 万 USDT
    2025-08-11 17:47:48
    数据:上周共有 53 份比特币战略储备相关公告发布,新增储备约 5000 枚比特币
    2025-08-11 17:41:15