V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 114 页 / 共 130 页
回复总数  2600
1 ... 110  111  112  113  114  115  116  117  118  119 ... 130  
@lolizeppelin 感谢提醒, 我都快忘了那个库了, 刚听说 jsonschema 可以支持 Union Optional Dict[str,int]。
呃,show me your code?
@Trim21 感谢,找了半天没找到,vscode 对这些相对路径的跳转太差了。。。已解决
@Trim21 我之前第一选择是 pydantic , 后来因为看文档不仔细给弃用了, 结果仔细看了下文档, 觉得真香, 把我 3 个多小时写的垃圾全弃用了...

gist 我这边污染打不开, 好容易换 192.30.253.118 结果说 404..
我先研究研究用 type 动态构造 BaseModel 子类

from pydantic import BaseModel
import typing
import inspect


def test(a: int, b: typing.Dict[str, int]):
pass


sigs = inspect.signature(test)

kwargs = {p.name: p.annotation for p in sigs.parameters.values()}
@skinny 我就是打算研究研究有什么自带的内置方法可以让我验证么, 毕竟 isinstance 是报错的
@ipwx 好吧, 我傻了, 还是用 pydantic 吧
说白了其实我就是想知道下 typing 里那么多复杂的类型, 怎么做验证, 学习的目的
@ipwx pydantic 看过了, 不过当时只看了它的那些 BaseSchema 用法, 就是自定义, 不过我要处理的是 typing 里的内置类型(或者复合类型)
我只是想对某些值做一下类型校验, mypy 上没找到, 官方文档也是说 typing.cast 太影响性能所以什么都不做, 只留给 linters 做猴子补丁
我看看那些 mypy 以外的有没有什么办法吧
2019-10-09 18:25:02 +08:00
回复了 dhairoot 创建的主题 程序员 怎么克服学习 Go 时的恶心感觉,语法太奇怪了
很多不习惯的地方只能靠肌肉记忆来改善了

我还不喜欢写字呢, 不也是忍着来了

话说这帖子到底怎么火起来的
2019-10-09 18:20:54 +08:00
回复了 prenwang 创建的主题 程序员 为什么一些我们认为很棒的软件工具被慢慢放弃了
善用佳软影响了一代人, 在那么匮乏的年代, 找个好的太难了.
话说我以为自己打开知乎了...
ws 请求也是能拿到的, 拿不到的可能性太多了... 目前已有信息来说, 靠猜的话不亚于一道面试题了..
@kon9chunkit 好, 现在国内外把 star 弄得乌烟瘴气的了, 想回归开源风气考虑下防作弊 page rank 方面的论文, 毕竟我国人口众多, 只看 star 的话会自动把外国降权, 看了一眼这项目你自己搞的, 也真不容易了...
综合评分按理说该 github 内部搞, 外部请求 api 的效率太低了, 更别提防作弊算法要的大数据量
可以搞榜单, 不过不要用 star 好吗
UsedBy
Fork
Watch
Sponsor
最后才看 star, 上面 4 个加权求值和 star 的比例就可以拿到一个综合分数了
2019-10-07 10:48:06 +08:00
回复了 qazwsxkevin 创建的主题 Python selenium+webdriver 如何实现这种半自动响应?(爬虫)
@qazwsxkevin 火狐... grease monkey... 怀念... 反正这些大浏览器都可以开远程调试模式用 websocket 通信, 没问题的. 至于学习成本, 还是跟着最着急的需求来, 什么熟悉用什么吧
2019-10-07 10:46:04 +08:00
回复了 qazwsxkevin 创建的主题 Python selenium+webdriver 如何实现这种半自动响应?(爬虫)
@jowenzzzzz 先熟悉 JS https://zh.javascript.info/ , 其实如果有其他语言基础, 直接看 mozilla mdn javascript 是最权威的. 前几年可能我还推荐下 阮一峰 廖雪峰, 现在基本不会推荐看教程了
再看 tampermonkey 文档, 对于不成规模的爬虫, 这么个扩展已经挺够用了, 内置了一大些自动化东西
2019-10-07 10:27:26 +08:00
回复了 qazwsxkevin 创建的主题 Python selenium+webdriver 如何实现这种半自动响应?(爬虫)
我 cdp 操作 DOM, 各种 NodeID 烦死了, 最后还是用注入 JS 方式操作的 DOM... 那个 pyppeteer 作者也直接用的 JS, 有个 issue 专门解释了, cdp 操作 DOM 性能不行
2019-10-07 10:07:18 +08:00
回复了 qazwsxkevin 创建的主题 Python selenium+webdriver 如何实现这种半自动响应?(爬虫)
你都半自动了, 还抱着 selenium 不放... 很多写爬虫教程的自己都一知半解的, 从 CSDN 上抄个 selenium quick start 就劝人用 selenium 写爬虫了.

给你两条简单的路子吧
1. 使用 tampermonkey 注入 JS, 会点 JS 然后了解一下它原生的基础功能(比如操作剪贴板), 可以对网页随便蹂躏, 我常用的就是给网页里直接注入七八个按钮, 需要的时候就点, 有时候也可能给 body 绑定双击操作, 然后 pyperclip 监听下剪贴板就够了, 曾经用这个做过某不存在网站里 mp4 的下载
2. 研究研究 chrome 那套 cdp 协议, 前几天正好手撸了一个支持协程的请求库, 肯定不如 puppeteer, 但是这东西我连名字都背不过... 也基本用不上太多功能... 跑题了, 你这种要求, cdp 里有个 Response.receive 事件监听起来, 就可以了, 任何请求, 包括静态页面 ajax 图片, 都可以监听. 当然直接上 pypperteer 也挺不错的
3. 简单写个 chrome 扩展, 不过大多数情况不如直接 tampermonkey 简单, 除非要特别高权限才考虑它, 我很多人机交互的都改到 tampermonkey 上了
2019-10-06 20:25:34 +08:00
回复了 augustpluscn 创建的主题 问与答 windows 平台有 auto suggestion 吗?
@augustpluscn Windows 上原装的是没有, 那个确实 high 翻天, linux 上换过十几次主题, 好看的不得了

Windows 的话, WSL / WSL2 上可以装. 要么就 server 版 linux 虚拟机跑一下, 反正现在正经 IDE 都有 remote debug. 逼急了 docker 不知道 zsh 什么体验.

现在用 cmder, 一开始真是舒服, 越用发现的问题越多... 更新以后启动就算 fast 模式也大约 2 秒... 唉, git bash 凑合用着了
2019-10-06 15:26:58 +08:00
回复了 augustpluscn 创建的主题 问与答 windows 平台有 auto suggestion 吗?
zsh auto suggestion ?
2019-10-06 13:56:48 +08:00
回复了 cyrbuzz 创建的主题 问与答 突然多了很多未读提醒...
前几天我还以为是那群人说的降维攻击... 啊不, 降权
哈哈
1 ... 110  111  112  113  114  115  116  117  118  119 ... 130  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2350 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 44ms · UTC 10:20 · PVG 18:20 · LAX 03:20 · JFK 06:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.