2026 年 4 月 17 日,美国西北大学的 Dashun Wang 团队在 arXiv 发表研究论文,提出双重可读性的 LLM 原生图表全新框架概念,并进一步构建了名为 Nexus 的原型系统。使用 Nexus 系统在大学创新数据上进行的案例研究表明,研究者可以通过自然语言与直接图形操作的无缝切换,完成从模糊探索到精准洞察的完整链条。该论文从底层逻辑上重新定义科研插图,让它成为人机协同发现的全新起点和交互界面。
放眼科研工具领域,一湾生命科技同样布局前沿。公司已上线 EthoClaw,打造业内首个神经行为学龙虾智能体,可一键完成动物行为分析与论文组图制作;公司已上线 EthoAI 云平台(ethoai.bayonesci.com),实现云端动物行为分析,依托 EthoAgent 智能体自动解读实验结果、生成科研报告,构建起完整的智能化行为研究解决方案。
大语言模型(Large language models, LLM)正在重塑科研工作流,其作用不仅体现在生成能力上,更体现在工具使用、数据推理与复杂分析任务协同等新兴能力上。但在绝大多数人机协作场景中,作为核心输出的图表仍被当作静态视觉摘要:一旦渲染完成,人类与多模态大模型都只能将其视为图像,从像素或图例中重新解读。大模型的涌现能力为我们从根本上重新思考这一范式提供了可能。本框架建立在三大前沿方向之上:AI 驱动的科学发现、交互式可视化数据探索、人机 - 大模型交互,它们共同为加速数据密集领域的人类理解提供关键支撑。
2026 年 4 月 17 日, 美国西北大学的 Dashun Wang 团队在 arXiv 上发表了题为 “Figures as Interfaces: Toward LLM-Native Artifacts for Scientific Discovery” 的研究论文。该论文提出 LLM 原生图表(LLM-native figure)框架概念:一种同时具备人类可读性与机器可寻址性的数据驱动产物。 通过语言-视觉混合界面实现这一概念,将 LLM 智能体与图表–底层数据的双向映射相结合。研究在科学学领域测试证明, LLM 原生图表能够加速发现过程、提升可复现性,并在智能体与用户之间保持推理透明。更广泛地说,这项工作建立了一个通用框架,将溯源、交互性与可解释性嵌入现代研究产物中,重新定义图表:它不是最终产品,而是用于发现的接口。
01
创新破局:双重可读性 LLM 原生图表颠覆静态图表
该论文聚焦于科学发现中的图形表示问题,旨在解决传统静态图形无法有效支持人机协作和数据分析的挑战。为了解决上述痛点,论文提出了一个核心概念:双重可读性(dual-legibility) 。这不仅是做一个漂亮的可视化前端,而是从定义上彻底改造一张图的数据结构。这是一种同时具有人类可读性和机器可解析性的研究文物。关键技术包括一个混合语言 - 视觉接口,该接口实现了图形与底层数据之间的双向映射,使得用户可以通过自然语言指令和直接操作与数据进行交互,进而生成和扩展分析。
在一张 LLM 原生图表中,一张图(F)不再仅是一个静态像素矩阵,而是一个包含了四个维度的、活着的结构化对象。其定义可形式化为 F = {V, C, D, M} (四个维度的结构化复合物):
- V(Visualization,可视化):不仅包括人眼能看到的PNG图像,还包括纯文本的洞察总结,以及一份结构化的 Vega-Lite JSON 可视化规范。
- C(Code,代码):记录生成这张图所有计算流程的全部代码,包括数据过滤的 SQL 语句、数据建模和转换的Python脚本。同时,还实现了完整的版本管理,确保每一个操作步骤都清晰、可追溯且可重现。
- D(Data,数据):不仅包含底层数据库中抽取的完整数据,更包含了图表所引用的那个具体的数据子集。
- M(Metadata,元数据):记录了此次分析的生成时间、数据源关系、关联的探索阶段以及与其他 LLM 原生图表的协调关系网络。
这四个维度紧密耦合形成的 LLM 原生图表,实现了在传统静态图表中无法想象的突破:LLM 能精确追踪任一视觉标记的数据源、计算过程和可视化设定,能够实现追溯和扩展,进行下一轮更深入的分析任务。LLM 原生图表作为双向无损映射的交互界面,能实现人机协同探索。
02
系统落地:专为科学学打造的原型平台 Nexus
为了将这个框架变成真正可用的工具,研究团队开发了一套名为 Nexus 的原型系统。该系统深入 science of science (SciSci) 领域,允许科学家在杂乱复杂的科学创新数据中进行探索。
Nexus 的核心在于其内部的一套多智能体 LLM 引擎(Multi-Agent LLM Engine),由三大角色精密协作:
- 规划者(Planner):识别用户意图,负责将自然语言指令和交互动作分解为一系列具体的、逻辑上可执行的原子操作。
- 执行者(Executor):严格执行 Planner 生成的每一条原子指令,在安全的计算沙盒中生成具体的 SQL、Python 分析代码和可视化描述语言,获取数据处理结果。
- 评估者(Evaluator):对执行结果的质量和相关性进行评估,如果结果不符合预期或执行错误,它会修正错误或重新制定计划,确保最后交付的视觉分析结果具备高可靠性。
03
案例研究:LLM 原生图表潜入大学创新的数据深海
研究团队以美国某顶尖研究型大学的创新数据为试验场,其中融合了发明披露记录、专利引用论文、教师职称与院系等多元异构信息。任务目标非常现实:绘制大学的创新图景,找出谁在产生技术影响力,以及谁是创新潜力股。
- 研究人员给出指令:“以发明披露数为 y 轴、专利引用论文数为 x 轴,展示发明人分布。” Nexus 给出交互散点图,但重尾分布让数据挤成一团。
- 研究人员框选散点图,给出指令:“把 x 和 y 轴都换成对数轴,用 log(x+1) 避免零值。” Nexus 识别意图,原地更新数据变换和视觉编码,图表瞬间清晰——整个过程被完整记录,随时可回退。
- 研究人员刷取高活跃群体和论文被专利大量引用却发明零披露的沉默区,给出指令:“用柱状图展示这些人的院系分布。” Nexus 自动生成协调的柱状图,两组人的院系对比直观呈现:化学、材料学科霸占活跃区,而沉默力量分布更广。
- 研究人员刷取沉默区区域,追问指令:“初/高级教员各占多少”。Nexus 自动生成饼图,揭示出一个极具政策含义的发现:近一半的初级教员落在这个“有技术影响力但零披露”的区域,而资深教员中这个比例仅约三分之一。
实验结果表明,LLM 图表能够加速科学发现,提高可重复性,并使得不同代理和用户之间的推理过程更加透明。具体而言,使用 Nexus 系统进行的案例研究显示,该方法在多步骤科学分析中表现出色,相比传统方法显著提升了数据探索的灵活性和效率。
04
实证检验:Nexus 的双向映射有多可靠?
双向映射机制正是 LLM 原生图表最核心的价值所在:不仅要能把自然语言指令或操作,准确地转成可视化的数据洞察,还得能反向操作——把视觉交互,比如点击或框选一个数据点,精准地还原成对应的数据子集和分析操作。
为了验证这一机制,研究团队设计了一套系统化的计算实验,构建了 308 个覆盖不同图表类型、交互方法和分析复杂度的测试用例,对 Nexus 进行全方位的压迫测试。实验结果表明:
- 在分析操作 → 可视化(Initial Question) 方向,也就是根据自然语言指令生成图表:系统的端到端执行成功率达到了 96.7%,最终的分析精准率达到了 92.7%。
- 在可视化 → 分析操作(Follow-up Question) 方向,也就是从视觉交互中反向解码人类的意图:系统的端到端精准率达到了 79.8%。
- 对于图表间的动态协调(Coordination) 任务,例如在一张图上刷取后,另一张关联图表自动刷新:其总体的成功率高达 91.0%。
这些数据结果不仅表明了该系统在生成图表和解释图表两个方向上都具备可用性,更是宣告了 LLM 原生图表在工程层面具备了可行性与鲁棒性。
05
研究意义:大模型下人机交互界面的范式跃迁
该研究为科学发现提供了新的思路,推动了科学图形从静态输出转变为交互式、可追溯的分析接口。其贡献在于建立了一个通用框架,能够将可追溯性、交互性和可解释性嵌入现代研究文物中,值得关注的原因在于其潜在的广泛应用于各类科学研究场景。这个框架是领域无关的(domain-agnostic)。无论你从事的是脑科学、材料学还是金融量化分析,它所提出的理论架构都具备普适的迁移和落地的潜力。
在跨学科融合与大模型赋能的科研浪潮下,一湾生命科技深耕底层技术自研。目前团队已推出首款神经行为学专用龙虾智能体 EthoClaw,可高效完成动物行为量化分析与标准化论文配图;团队还自主研发 EthoAI 云平台与 EthoAgent 智能体,依托云端算力架构,实现动物行为数据的批量分析、实验结果智能解读与报告自动化产出,形成了一体化、智能化的行为学研究解决方案,为生命科学领域的人机协同科研探索提供全新技术支撑。
如果你也对此类智能科研工具感兴趣,欢迎前往 EthoAI 云平台(ethoai.bayonesci.com)亲身体验探索。






