
|  |      1clemente      175 天前  1 6666 | 
|  |      2newdongyuwei      175 天前  1 赞 | 
|      3followad      175 天前 via iPhone  1 赞👍 | 
|  |      4Pipecraft      175 天前 包含评论吗?怎么才有 181 MB ,这么少。 | 
|  |      7Patrick6      175 天前  1 昨天刚从 X 看到,今天又在 v 站看到了哈哈 | 
|      8MzM2ODkx      175 天前  1 赞 | 
|  |      10JJJLG      175 天前 1 | 
|  |      11mywaiting      175 天前  6 Hacker News 的数据库很大程度算公开数据源,很多地方都有下载 1 、官方 API 接口,使用 Firebase 提供,近乎实时更新数据 https://github.com/HackerNews/API 2 、全量数据搜索接口,Algolia 提供,API 提供每 IP 每小时 1w 访问限制(等于无限制) https://hn.algolia.com/api 3 、graphql API 。它将允许您在单个请求中获取所有评论、用户和帖子 https://hngraphql.fly.dev/graphql 由于 HN 的数据本身就是公开的,爬虫抓取到本地意义不大 | 
|      12ammeto      175 天前  1 赞👍 | 
|      13punkerhyde      175 天前  1 66666666666666666 | 
|  |      14hidev OP  1 @mywaiting 这里用的就是官方 API ,下载下来目的是可以做一些离线分析,比如词云,比如训练个 Hacker News LLM | 
|  |      15Akagi201      174 天前  2 评论这么关键的数据没有啊? hn 主要价值就是评论啊 |