有没有一种爬虫服务，只需要我指定网站和规则，就可以定时爬数据，并且可以提供我指定格式的 json api 的

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 2911 天前的主题，其中的信息可能已经有所发展或是发生改变。

如题，希望各路大佬知道，告知一下。

PS：本人比较喜欢看自然科学相关的文章，经常看环球科学的网站，加上我是做 iOS 开发的，所以我想用 swift 做一个 app 方便看文章。

本来是想自己做全栈的，包括设计和前后端(前后端全用 swift)，但是由于我对爬虫方面的知识不太了解，我想先完成 app，后期再用 Perfect 自己学习写爬虫程序。所以要是有现成的爬虫并且是开源的就最好了😄。

爬虫

Swift

全栈

App

46 条回复 • 2018-12-15 15:04:50 +08:00

loading

2018 年 3 月 3 日 via iPhone

幽灵蛛

malagebidi

2018 年 3 月 3 日

用 huginn+feedly，完全满足需求。

devjoe

2018 年 3 月 3 日 via iPhone

直接加载整个网页，然后利用 XPath 解析就行

bogun

2018 年 3 月 3 日 via Android

可以试一下 portia，可视化爬虫

likuku

2018 年 3 月 3 日

IFTTT ？

chroming

2018 年 3 月 3 日 via Android

可以看下 pyspider

4BVL25L90W260T9U

2018 年 3 月 3 日 via Android

那你就先 mock 一个数据开发呗，做完再说。说不定中途就放弃了

lScarlet

2018 年 3 月 3 日 via Android

马克

brotherlegend

2018 年 3 月 3 日 via Android

看大佬们回答

yuanfnadi

2018 年 3 月 3 日 via iPhone

toapi
可以把网站变成 api

silencefent

2018 年 3 月 3 日

神箭手

giuem

2018 年 3 月 3 日 via iPhone

https://wrapapi.com/

safedogcc

2018 年 3 月 3 日

这不就是我的 APP [下一栈]( https://nextstack.xyz)
该做的事吗！

原理也是一样，把网站的 html 或者 rss 或者 json api 转换成固定的 json 数据格式，只不过不用爬虫，直接在客户端进行爬取解析，欢迎体验！

sparkssssssss

2018 年 3 月 3 日 via iPhone

马克

zhtttyecho

2018 年 3 月 3 日

马克

zhesheng

2018 年 3 月 3 日 via Android

马克

anonnymous

2018 年 3 月 3 日

克马

Esora

2018 年 3 月 3 日

mark

leriou

2018 年 3 月 3 日

八爪鱼试试

sohoer

2018 年 3 月 3 日

可以先试用下 hicrawler.com ，目前支持 json api 或发布到 wordpress

just1

2018 年 3 月 3 日 via Android

@safedogcc 在安卓版好像只看到了 rss 和知乎专栏

golmic

2018 年 3 月 3 日 via Android

我可以免费提供数据方面的技术支持。微信 lujqme，可以联系我

limbo0

2018 年 3 月 3 日 via iPhone

不趁现在学习一波 python 吗

rootit

2018 年 3 月 3 日

你想的太简单了。。。

safedogcc

2018 年 3 月 4 日

@just1 #21
这类是固定的解析模版，比如 v1.4 的简书专题（近日发布），v1.5 的 hexo 博客支持（待发布）以及后续的 wordpress 博客站点等等一些较常用的 cms 系统（因为基本 dom 元素一致，所以解析代码通用）。

当然，你有兴趣可以看看开发文档，你会发现绝大部分的网站都可以进行创作哒！