V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
ACool
V2EX  ›  Python

最近用 Python +Mysql 做了一个微博用户信息分析

  •  
  •   ACool · 2018-07-03 15:52:40 +08:00 · 2269 次点击
    这是一个创建于 2340 天前的主题,其中的信息可能已经有所发展或是发生改变。

    可以爬取微博用户个人资料以及动态信息。

    项目地址: https://github.com/starFalll/Spider

    数据分析:

    • 生成词云
    • 统计词频
    • 统计活跃时间
    • 使用 LDA 构建了微博主题模型
    • 更多功能...

    UI:

    • 生成良好的 UI 数据分析与展示界面
    第 1 条附言  ·  2018-07-03 16:54:16 +08:00

    源码里面注释写得很清楚,另外lz也写了一篇文章 爬虫实战(一):爬取微博用户信息

    4 条回复    2018-07-03 18:22:18 +08:00
    ACool
        1
    ACool  
    OP
       2018-07-03 16:54:34 +08:00
    源码里面注释写得很清楚,另外 lz 也写了一篇文章 爬虫实战(一):爬取微博用户信息
    ZeroW
        2
    ZeroW  
       2018-07-03 18:13:15 +08:00
    User-Agent 都写错了,楼主确定跑过???
    ACool
        3
    ACool  
    OP
       2018-07-03 18:18:36 +08:00
    @zerowang317 #2 那个是之前随便加上去的,这个我在配置文件里面已经说了需要自己改
    ACool
        4
    ACool  
    OP
       2018-07-03 18:22:18 +08:00
    @zerowang317 #2 代码全是我自己写的呀,不然 gif 图怎么来的,跑过很多次了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3096 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 13:47 · PVG 21:47 · LAX 05:47 · JFK 08:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.