xoxo419
V2EX  ›  问与答

scrapy 爬虫采集多个站点,会不断增加站点,如何工程化项目呢 是把全部站点的爬虫写到一个 scrapy 还是每个站点都创建一个 scrapy 工程?

  •  
  •   xoxo419 · Oct 25, 2024 · 1381 views
    This topic created in 578 days ago, the information mentioned may be changed or developed.
    3 replies    2024-10-25 13:41:08 +08:00
    qfly
        1
    qfly  
       Oct 25, 2024 via Android   ❤️ 1
    简单的办法是一个站点一个 然后挂在 scrapyd 下 ,crontab 触发或者外部网站都可以触发,数据进数据库不同表。 由于每个站点内容不一样 很难统一数据库表结构。如果数据类似 那么就将所有数据写入同一批表,用关键词区分不同网站。当然你能将整理出规则,那也是可行的,数据库就设计的复杂点,定义元数据,根据要求写入不同表。但如果没几个网站这样做不值得。
    EndlessMemory
        2
    EndlessMemory  
       Oct 25, 2024
    每个站一个
    Pepsigold
        3
    Pepsigold  
       Oct 25, 2024 via Android
    @qfly 大佬逻辑清晰,受教了!
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1154 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 18:15 · PVG 02:15 · LAX 11:15 · JFK 14:15
    ♥ Do have faith in what you're doing.