V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  blueboyggh  ›  全部回复第 3 页 / 共 69 页
回复总数  1369
1  2  3  4  5  6  7  8  9  10 ... 69  
215 天前
回复了 Inzufu 创建的主题 中国 国内大厂的“数据下载”功能就是摆设
@ltkun op 好像说的是想从华为下载了数据传到 iphone 上
220 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft
@NoOneNoBody

由于现在数据量上升到了将近 10w 条,现在跑完一遍数据需要二十多个小时,这个滑动窗口的方法,还有什么能优化的地方吗?比如上多线程啥的?
238 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@NoOneNoBody 好的,确实是#49 的时间最短,感谢
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 感谢,测试使用新代码,结果里没有相互包含的子元素了
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft 使用 18#的代码后,测试 100 条数据时间从 63 秒变成 59 秒,好像变化不多,是不是我的问题?
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@NoOneNoBody 期待新代码共享
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft 我的问题,18#的源码我只应用了前后对比两次的逻辑,其他的没用,估计影响了结果,一会儿我修改一下再测试一下试试
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar
@NoOneNoBody

我从我的样本里取了 100 条数据,用三种方法都进行了测试,测试结果:

滑动窗口方法:13 秒完成
itertools 方法:28 秒完成
正则表达式方法:63 秒完成

其中滑动窗口的方法,取出来的样本是最全的,但是结果 list 里一些子元素有相互包含的情况,比如“中了 500 万彩票”和“了 500 万彩票”
itertools 方法的结果更加精简,但是依旧有子元素有相互包含的情况
正则表达式方法则是完全没有子元素有相互包含的情况,但是速度也最慢

以上结果可能因为本人代码小白的问题受影响,不代表三种方法的真实水平,或者有其他隐含的坑我没能力发现
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@NoOneNoBody 谢谢,改成 list 就好了,next 是从网上抄的。
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar
@NoOneNoBody

对,现在输出能出第一个相同字符串“是个好日子,”了,但是“中了 500 万彩票”没有,是因为我对 yield 返回的 x 的处理方式不对吗?
239 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
https://pastebin.com/raw/irdJS0iK


@NoOneNoBody 麻烦给看看我处理的缩进和完善的 demo 是否有问题?测试结果只能输出一个“ 万彩票”
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 感谢,目前正在测试之前的代码,跑了 3 个小时,跑了 1300 条数据了
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 主要是我需要对比的数据是上千条的 excel ,一个一个复制到文本文档,效率太低了吧
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 我发现了,因为我是从 excel 表格里提取的内容,如果内容里有换行符,就会影响判断,即使换行符并不在需要提取的相同文本内,也不行,这是因为换行符会影响字符串提取吗?
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 实际我的长度需求是 8 ,我改成 8 了,也不行,我题目中这个例子是可以的,但是我实际需要用的字符串不行
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft
@szdosar

我发现用二位的代码,用我题目中的例子就可以正常运行,但是用我实际需要匹配的字符串,就找不到匹配项,可是明明里面就有匹配项。哪位能加个联系方式帮帮忙...有偿也可以
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 好的,我先用了楼上老哥的代码,先测试,回头再试试您的
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft 十分感谢您!祝您中 500 万!
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@flyqie 我测试了一下,好像不用改#号数量也能用
240 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@flyqie 不太理解您的固定和动态调整的意思?
1  2  3  4  5  6  7  8  9  10 ... 69  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2286 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 09:28 · PVG 17:28 · LAX 02:28 · JFK 05:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.