文章目录0. 栏目介绍1. 本期选品 选品理由2. 项目历史3. 项目速览4. 深度解析4.1 整体 Pipeline5 步4.2 Cross-source Cluster Merging4.3 对比查询的实现方式4.4 GitHub Person-mode4.5 自动化测试5. 重点任务展开5.1 评分维度方法论根基5.2 Polymarket 真实押注赔率5.3 双 Judge 模型6. 3 个使用场景6.1 调研一个海外开源项目6.2 调研一个国内 AI 公司的海外表现6.3 跟进热点话题7. 局限与适配场景7.1 局限7.2 适配场景7.3 一点个人观察8. 快速上手8.1 准备工作8.2 5 种安装方式8.3 第一次运行8.4 输出结构8.5 输出成可分享 HTML附录项目链接同类项目对比供横向参考数据说明0. 栏目介绍这是我新开的一个栏目——GitHub 每周热点项目深度解析。预计每周一篇。挑 GitHub Trending 周榜上数据最值得看的项目做一次比30 秒 README 速读更深的拆解从项目历史、作者背景、到具体怎么用、为什么值得用、有没有同类项目可以横向对比。第二期挑了mvanhorn/last30days-skill。1. 本期选品 选品理由2026 年 6 月 14 日单日新增 3,558 Stars位列 GitHub Trending 日榜第一数据截至 2026-06-1414 类社区数据源聚合——Reddit、X、YouTube、TikTok、HN、Polymarket、GitHub 等。GitHub 上能同时接入这么多 walled garden 的项目不多v3.3.0 跑了 1,012 项自动化测试通过——截至 2026-05-17 累计 14 个 release属于持续迭代型维护Polymarket 真实押注赔率作为评分信号——把真金白银纳入评分体系是产品方法论上的差异化截至 2026 年 6 月 14 日以项目名检索暂未发现相关 CSDN 文章——首发窗口期2. 项目历史维护者mvanhorn。时间线v1简单多平台搜索聚合器关键词驱动——痛点是搜出来的内容跟实际想要的 entity 经常对不上v2引入多平台 worker agent 并发抓取按 upvotes / likes / Polymarket 押注赔率排序2026-05-17v3.3.0 发布2026-06-1441,708 stars、3,389 forksCHANGELOG 显示累计 14 个 releasev3 架构质变v3 之前先用 Python pre-research brain 把 topic 解析成 entity graph再开始抓取。这是 v3 整个架构的最大质变点——v2 没有这一步搜出来的内容跟实际想要的 entity 经常对不上v3 搜Cursor自动展开成 cursor_ai、r/cursor、相关 GitHub repos、相关 YouTube channels。贡献者归属项目由 mvanhorn 维护README 将 v3 engine architecture 归功于 j-sperling。社区里 itsjasonai、itswilsoncharles 等 KOL 的 X 真实使用反馈也推动了项目迭代。3. 项目速览一句话定位把 Reddit、X、YouTube、Polymarket 等 14 类社区数据源并行检索、汇总成结构化调研报告的 AI Agent Skill根据 API key、查询类型和配置启用其中可用的数据源。基础数据截至 2026-06-14维度数据Stars41,708Forks3,389语言Python 98.3%Shell 1.1%HTML 0.6%最新版本v3.3.02026-05-17 发布累计 Release14 个协议MIT自动化测试1,012 项通过三大核心亮点多平台并行抓取支持 14 类主要数据源根据 API key、查询类型和配置并行启用其中可用的数据源真实行为评分Reddit upvotes、X likes、YouTube views、Polymarket 真实押注赔率——采用不同的排序信号更重视互动量、相关性和新鲜度自备 API key 模式Reddit、Hacker News、Polymarket 无需额外配置其他平台需自备 key14 类数据源清单数据源类型入门门槛Reddit comments社区无需额外配置Hacker News社区无需额外配置Polymarket押注无需额外配置GitHub代码需要 GitHub Token 或 gh CLI 登录DiggAI 1000 leaderboard需系统中存在 digg-pp-cliX / Twitter社交浏览器登录YouTube transcripts视频brew install yt-dlpBluesky社交App passwordTikTok视频ScrapeCreators keyInstagram Reels视频ScrapeCreators keyThreads社交ScrapeCreators keyPinterest图片ScrapeCreators key按需Perplexity SonarAI 搜索OpenRouter key按需Web (Brave)网页Brave API key2,000 免费/月它跟传统搜索的差异传统搜索引擎Google、Perplexity、Brave 等主要覆盖网页内容last30days-skill 主要覆盖社区信号——Reddit 评论、X 推文、TikTok 字幕、Polymarket 押注这类传统搜索覆盖较少的内容。两者覆盖场景不同适合搭配使用传统搜索适合查文档、找教程、定位资源last30days-skill 适合查人在想什么、社区怎么看、市场怎么押注。4. 深度解析4.1 整体 Pipeline5 步用户输入 topic ↓ [Step 0] Entity resolutionpre-research brain ↓ 把Cursor映射成 cursor_ai r/cursor GitHub repos YouTube channels [Step 0.5] 可选competitor discovery--competitors 自动找 2 个 peer entity ↓ [Step 1] 已配置的数据源 worker agent 并发抓取 ↓ [Step 2] 行为评分relevance humor 双 judge ↓ [Step 3] Cross-source cluster merging同一故事合并 ↓ [Step 4] AI judge 综合成 markdown / HTML 简报第一步 entity resolution 是 v3 整个架构的最大质变点。工程上要做双向解析person → company、product → founder、name → GitHub profile。README 将 v3 engine 核心架构归功于 j-sperling。4.2 Cross-source Cluster Merging传统搜索的常见现象同一事件在 Reddit 一帖、X 一推、YouTube 一视频被算成 3 条独立结果。v3 的解法是 entity-based overlap detection——不靠标题相似度标题经常用不同词靠底层 entity 是不是同一个。4.3 对比查询的实现方式对比查询会为每个 entity 分别执行完整检索 pipeline并行运行以控制总耗时最后合并为对比报告。--competitors会先发现两个同类对象再为每个对象生成独立检索计划。README 给出的多对象对比示例约需 3 分钟。4.4 GitHub Person-mode当 topic 是人时pipeline 切换到 author-scoped queries——直接查 PR 速度、release notes、最近一个月的项目动态不再泛搜谁在某 issue 里提到了这个名字。4.5 自动化测试v3.3.0 跑了 1,012 项自动化测试通过CI 全过。仓库包含针对 entity resolution、Polymarket noise filtering、per-author cap 等机制的相关测试。5. 重点任务展开本节拆解 last30days-skill 最核心的 3 个机制——评分维度、Polymarket 应用、双 judge 模型。理解了这 3 个机制就理解了这个项目的方法论根基。5.1 评分维度方法论根基last30days-skill 的评分维度表是整套方法论的核心证据平台主要互动信号Reddit帖子分数、评论数、upvote ratio、热门评论Xlikes、reposts、replies、quotesYouTubeviews、likes、comments、热门评论TikTokviews、likes、comments、热门评论HNpoints、commentsPolymarket内部参考 volume、liquidity报告展示 oddsGitHubissue/PR 互动person-mode 另外汇总 PR、Stars、Release核心思路采用不同的排序信号更重视每个平台自己的用户行为信号编辑权重不是主要排序依据。使用场景示例具体输出取决于 query可以用于检索DeepSeek 最新模型的海外接受度——GitHub 上 deepseek-ai/DeepSeek-V3 的 PR 节奏、X 上 deepseek_ai 的 likes/retweets、Reddit r/LocalLLaMA 上的测评帖 upvotes 都可作为评分输入。5.2 Polymarket 真实押注赔率README 原话“Not opinions. Odds. Backed by real money.”Polymarket 是预测市场每个事件都有真实押注赔率% 概率背后是真金白银。这种信号比单纯的专家分析更难反驳——因为有人愿意为这个判断付钱。输出 vs 内部排序Polymarket 在内部排序中仍会参考 volume 和 liquidity如源码所示的 engagement score 大致是 volume 60% liquidity 40% 之类权重但最终报告主要展示市场赔率避免交易金额干扰阅读。Polymarket noise filteringcommon-word disambiguation 防止 “Apple” 匹配 “Will Apple release a car?”——这是 entity disambiguation 的具体应用。注意点预测市场同样受流动性、参与者结构和市场规则影响。Polymarket 信号是参考维度之一不是唯一信号源。5.3 双 Judge 模型v3 引入的双 judge 模型是产品决策上的小创新——传统搜索只评 relevanceReddit 和 X 上经常有一种情况一句话 relevance 极低但幽默度极高是那种让人想截图分享的金句。v3 用两个 judge 并行打分Relevance judge决定内容能不能进主报告Humor judge单独打 “funny score”最高的 quote 进报告末尾的Best Takes段fun score 不仅高亮还会混入正文叙事——最妙的一句会在最相关的段落里被引用。附加机制Per-author Cap项目默认限制为每位作者最多 3 条防止单一作者刷屏Entity Disambiguation引擎解析 handles 时做 entity 消歧——不会把同名 entity 误匹配成无关内容6. 3 个使用场景last30days-skill 的核心价值在调研——但具体怎么用取决于调研对象和读者能接触到的数据源。下面 3 个场景都是从国内开发者日常工作里抽出来的。6.1 调研一个海外开源项目最近想选型一个新工具但网上中文资料滞后英文社区评价才是最新参考。/last30days Rust async runtime 2026可以用于检索 Reddit r/rust 上关于 tokio 1.40 的讨论、X 上 Rust 核心开发者的公开观点、Hacker News 上相关 PR 的争议点。具体输出结构见 §8.4。6.2 调研一个国内 AI 公司的海外表现DeepSeek 在国内热度高但海外市场反馈才是它真正的验证场。/last30days DeepSeek 深度求索可以用于检索 Reddit r/LocalLLaMA 上的模型测评对比、X 上 deepseek_ai 的发声节奏、Hacker News 上关于 V3 模型发布的讨论。国内外信号交叉验证——比单看中文媒体评价更立体。6.3 跟进热点话题最近某个 AI 公司发布新产品想快速看社区反应。/last30days Anthropic Claude 4 eli5 onELI5 模式让 AI 把所有内容翻译成大白话输出——技术报告变成小明能听懂版本。同一份数据技术受众和非技术受众都覆盖。7. 局限与适配场景7.1 局限这套工具有几个天然边界——覆盖的社区主要是英文圈Reddit/X/TikTok/HN/Polymarket 都是英文世界。国内社区信号知乎、CSDN、掘金、微博不在它的数据源里完整调研通常需要数分钟不适合秒级监控和突发事件告警付费墙内容抓不到Reddit 评论抓得到付费文章抓不到7.2 适配场景last30days-skill 最擅长的是英文社区信号聚合。以下场景下它的价值较大需要快速了解海外开源项目 / 工具 / 公司的真实社区反馈技术选型、竞品分析、出海调研需要跟踪海外技术话题热度变化趋势监控、海外市场预判需要多源交叉验证投资参考、海外政策风险评估如果需求是中文社区舆情监控、学术文献调研、付费墙内容抓取更合适的方向是专门的国内舆情工具 / Google Scholar / 学术数据库 / 自建爬虫——last30days-skill 不是为这类场景设计的。7.3 一点个人观察跑了几次之后几个被低估的细节Polymarket 真实押注赔率作为评分信号是产品方法论上的差异化——其他类似工具大多停留在 upvotes/likes 层面ELI5 mode让一份数据能切换两种表达不用重跑两次Best Takes 双 judge把幽默度作为评分维度之一Reddit 和 X 上那些让人想截图分享的金句不再被埋在长报告末尾8. 快速上手8.1 准备工作Python 3.12v3 要求 3.12一个 Claude Code / Cursor / Codex / Gemini CLI 客户端可选 API keyX 浏览器登录、YouTube 装 yt-dlp、ScrapeCreators key、OpenRouter key首次安装不需要配任何 keyReddit、Hacker News、Polymarket 三个数据源无需额外配置GitHub 需 Token 或 gh CLI 登录。8.2 5 种安装方式# 方式一Claude Code推荐/plugin marketplaceaddmvanhorn/last30days-skill /plugininstalllast30days# 方式二通用 Agent Skills hostsnpx skillsaddmvanhorn/last30days-skill-g# 方式三claude.ai 网页版# 下载 last30days.skill → Settings Capabilities Skills 上传# 方式四OpenClawclawhubinstalllast30days-official# 方式五开发者手动调试gitclone https://github.com/mvanhorn/last30days-skill.gitln-s$(pwd)/last30days-skill/skills/last30days~/.claude/skills/last30days8.3 第一次运行/last30days Rust async 2026 # 调研一个技术话题 /last30days DeepSeek 深度求索 # 调研一家 AI 公司的海外反馈 /last30days Anthropic Claude 4 eli5 on # 调研话题 ELI5 模式 /last30days Cursor IDE --emithtml # 调研产品 输出 HTML 简报 /last30days 英伟达 H100 现货价格 2026 # 调研一个投资方向 /last30days OpenAI --competitors # 自动发现竞品 3-way 对比8.4 输出结构报告默认是结构化 markdown包含 4 段这个对象最近在做什么30 天动态时间线最近关注什么社区怎么看带具体 engagement 指标Best Takes妙句高亮8.5 输出成可分享 HTML/last30days Cursor IDE --emithtml产出文件~/Documents/Last30Days/cursor-ide-brief.html。HTML 是 inline CSS、system-font fallback、no JavaScript、可打印、可离线打开。可以直接拖进微信群、邮件附件、Notion。附录项目链接仓库mvanhorn/last30days-skillv3 engine architecture 由社区贡献者 j-sperling 设计同类项目对比供横向参考Perplexity通用 AI 搜索产品以网页检索和摘要为主不直接抓取 Reddit 评论 / X 推文等强社区信号传统 awesome-xxx 合集策展型项目如第一期 build-your-own-x以教程链接集合形式组织内容last30days-skill 是AI 主动调研 结构化报告形态跟合集型项目不同Hacker News / Reddit 站内搜索单平台搜索last30days-skill 跨 14 类数据源聚合数据说明数据截至 2026 年 6 月 14 日Stars/Forks 来自 GitHub API文中约 3 分钟是 README 给出的多对象对比示例耗时文中内部 volume 60% liquidity 40%是基于源码 engagement score 权重范围的描述具体比例可能随版本调整