V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Colorful
V2EX  ›  问与答

关于 Python 的几个问题

  •  
  •   Colorful · 2019-10-26 00:15:49 +08:00 · 1326 次点击
    这是一个创建于 1890 天前的主题,其中的信息可能已经有所发展或是发生改变。
    import re
    import urllib.request
    import urllib.error
    headers = ("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36")
    opener=urllib.request.build_opener()
    opener.addheaders=[headers]
    urllib.request.install_opener(opener)
    for i in range(2,10):
    aurl="http://m.qiushi.92game.net/?page="+str(i)
    pagedata=urllib.request.urlopen(aurl).read().decode('utf-8','ignore')
    data2 = pagedata
    pat='<div class="qiushi" id=".*?">(.*?)</div>'
    datalist = re.compile(pat)
    datalist2 = datalist.findall(pagedata)
    for j in range(0,len(datalist2)):
    print("第"+str(i)+"页第"+str(j)+"条内容是")
    print(datalist2[j])


    这是爬一个网站的代码,我想请教这么几个问题

    假如说做一个扩展的话,想单独爬标题我会,单独爬内容也会
    把爬出来的字段,放到数据库里面,或者放到一个表格里面,应该怎么样写?
    暂时在看 pyhton 方面的教程

    框架这块我还没开始学。想先多了解一下。
    5 条回复    2019-10-26 01:20:43 +08:00
    RicardoY
        1
    RicardoY  
       2019-10-26 00:43:16 +08:00 via Android
    贴代码可以用 markdown..插入数据库就直接插入啊..python 还拼错了..
    crab
        2
    crab  
       2019-10-26 01:00:36 +08:00
    选择个数据库,创建表字段等等,把 datalist2[j]执行插入。
    imn1
        3
    imn1  
       2019-10-26 01:05:09 +08:00
    那就看你用什么数据库
    sqlite 有内置 module,其他的一般需要第三方库,看它们带的文档
    一般是把数据组织为 sql 语句,然后执行写入
    CallMeReznov
        4
    CallMeReznov  
       2019-10-26 01:07:21 +08:00
    手建个库,然后循环 SQL 插入即可。
    ClericPy
        5
    ClericPy  
       2019-10-26 01:20:43 +08:00
    三个内置库的用法, 一搜教程一大把
    sqlite3
    json
    csv
    pickle

    从上往下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2668 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 11:58 · PVG 19:58 · LAX 03:58 · JFK 06:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.