ESC
输入关键词搜索文章
目录

🧑‍🔬 谁开源了他们的科研工作流?

一份关于科研大佬们工具链与工作方法的调研总结

📋 概述

科研工作流程的开源远不如代码开源常见。但有一小群富有影响力的研究者,在工具链和方法论上都做了充分的公开分享。 本报告整理了五位代表人物的工作流——从 Karpathy 的 AI 驱动知识库到 Carl Boettiger 的开放笔记本, 涵盖了 论文阅读 → 笔记管理 → 实验记录 → 知识积累 的全链路。

核心发现:完整开源科研工作流的大佬不多,但每个都很有启发性。2024–2025 年最大变化是 AI Agent 开始介入工作流,

从"工具辅助"转向"AI 全程维护"。

🔍 通用模式

不论工具是 Obsidian、Org-mode 还是 GitHub,这些工作流共享以下核心特征:

  1. 原子化笔记 — 将知识拆解为独立、可链接的基本单元
  2. 双向链接 — 在笔记之间建立关联,形成知识网络
  3. 增量积累 — 知识随时间演化,而非一次性整理
  4. 开放透明 — "Garage door up",工作过程公开可见
  5. 极简工具链 — 减少切换成本
  6. 自动化维护 — 让自动化处理书签工作,人类专注于思考

1️⃣ Andrej Karpathy — LLM Wiki + AutoResearch

OpenAI 联合创始人前 Tesla AI 总监Eureka Labs
AI 研究者 · 教育家

核心理念:让 LLM 作为知识库的 维护者,而不是查询工具。人类做思考,LLM 做 bookkeeping。

架构三要素

作用谁操作
raw/原始文档(论文、文章、图片),不可变你(只读)
wiki/LLM 生成和维护的 Markdown 文件(实体页、概念页、源文档摘要页)LLM(完全掌控读写)
CLAUDE.mdSchema 指令文件,规定结构、约定、工作流你和 LLM 共建

三个核心操作

与 RAG 的对比

维度RAGLLM Wiki
数据处理切块 + 向量嵌入 + 向量数据库Markdown 文件 + LLM 直接阅读
检索方式相似性搜索LLM 内生理解 + 结构化索引
可追溯性黑箱每条声明可追溯到 .md 文件
维护成本需向量数据库和嵌入服务只需要文件系统
知识积累每次从零发现增量编译,持续保持最新

AutoResearch — 科研实验自动化 Agent

630 行 Python 代码,运行 ML 实验的"Ratchet Loop"——自动循环执行实验、评估结果、只保留有效的变更。

项目地址:Karpathy's Gist


2️⃣ Andy Matuschak — Evergreen Notes

前 AppleKhan Academy独立研究员
UI 设计师 · 认知科学研究员

核心理念:笔记是思考环境(Thinking Environment),而不是记录工具。"Work with the garage door up"——公开分享自己的工作过程。

Andy 的 Working Notes 是数千条完全公开的常青笔记,作为他个人思考的实验场。

笔记分类

关键原则


3️⃣ Carl Boettiger — Open Lab Notebook

UC Berkeley 教授生态学开源科学先驱
生态与进化生物学家

核心理念:从 2010 年开始实时公开所有科研活动——包括失败的实验、代码、数据。这不仅是"开放",更是一种工作方法。

技术栈

组件用途
GitHub 仓库项目管理、版本控制、问题追踪(一个项目一个仓库)
knitr / Rmarkdown代码 + 分析 + 图表 + 文字一体式写作
Jekyll 博客时间线浏览、标签检索、RSS 订阅
R 包结构研究项目管理框架(数据、文档、源码规范化)

独特创新

成果:6 个项目从构思到发表,1 个 null result 公开存档,多次被合作者和审稿人引用工作流细节。


4️⃣ Katherine Hayes — Modified Zettelkasten + Obsidian

PhD 学生生态学U of Alberta
研究生 · 方法论达人

核心理念:"尽可能自动化书签工作,cut down on the busy work"——追求过程而非结果,每天以某种形式写作。

工具链

可贵的诚实:"很多笔记处于未完成状态"——这才是真实的科研状态。


5️⃣ 其他值得关注的实践者

Cameron Neylon — Science in the Open

生物物理学家,"LaBLog"方法:一个 Blog 条目对应一个研究物件(实验、想法、阅读)。强调失败也公开——让科学过程透明。

Awesome PKM for Academics

GitHub 上的资源集合,收录了数十个针对学术研究者的 PKM 工作流,涵盖了 Obsidian/Logseq 开箱即用 Vault、Zotero 集成、YouTube 教程等。
github.com/cecibaldoni/awesome-PKM-for-academics


📊 对比总结

人物 核心工具 工作流类型 自动化程度 开放程度
Karpathy Claude Code + Markdown AI 驱动知识库 极高(LLM 全程维护) Gist / 博客
Matuschak Custom system 常青笔记思考环境 低(手动写作) 完全公开
Boettiger GitHub + knitr + Jekyll 开放笔记本科学 中(自动签到/commit) 完全实时公开
Hayes Obsidian + Zotero Modified Zettelkasten 中(自动化归类) 博客 + 社区分享

💡 核心洞察

  1. 方法论 > 工具 — 原子化笔记、双向链接、增量积累是所有方案的核心
  2. AI 开始接管书签 — Karpathy 的"LLM 做 bookkeeping,人类做思考"可能是未来方向
  3. 开放是杠杆 — Carl Boettiger 发现开源笔记可以帮 reviewer 审稿、吸引合作机会
  4. 不完美才是常态 — 所有大佬的工作流都有未完成的部分,追求"足够好"而非"完美"
  5. 两条路径 — 极简主义(Markdown + LLM)vs 结构化集成(Obsidian + Zotero + GitHub)

🔗 参考链接