V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  zictos  ›  全部回复第 115 页 / 共 150 页
回复总数  2981
1 ... 111  112  113  114  115  116  117  118  119  120 ... 150  
好奇,刚看到是 50 多天前的帖子,除了我好像也没别人回复了,怎么会又到首页来。v2 有付费推广吗?
不错,收藏一下,不过暂时主要还是做百度 seo 这块,毕竟主要针对国内用户,要是百度 seo 多点资源就好了。
seo 的资源真的是挺少的,都不愿意分享,要是都像编程一样愿意分享,那学起来会容易很多。
不过 seo 有一定特殊性,可能随时面临搜素引擎改规则,有些技术分享出来后效果可能就不行了。就像爬虫一样,时时要面临各种反爬。还是编程安逸,seo 说到底就跟商业的竞争一样,很多词也都是有商业价值的词。
2021-03-06 10:48:26 +08:00
回复了 oldbird 创建的主题 Python cmd 运行 Python 文件时遇到错误如何停留界面?
@ysc3839 #6
只是省时间随便写一下,给楼主一个思路,达到能双击运行并且不退出的效果,暂时没考虑那么多。如果有问题可以多加几个判断。

不过获取父进程的名称确实是个好办法,这样就只需要在 py 文件的前面加上下面两行代码就可以了:

import os, psutil; pp = psutil.Process(os.getppid()).name();
if pp != 'cmd.exe': os.system('cmd /k "python %s"' % os.path.realpath(__file__))
2021-03-05 23:56:14 +08:00
回复了 oldbird 创建的主题 Python cmd 运行 Python 文件时遇到错误如何停留界面?
方法一:
先打开 cmd,再用 python test.py 这样的命令运行 py 文件就可以停留界面,双击不行。

方法二(只需要在每个 py 文件前面加上 10 行代码即可,代码中的****替换成四空格缩进):
import time, os
import win32gui as w
title = w.GetWindowText(w.GetForegroundWindow())
if 'cmd' in title:
****pass
else:
****os.system('title "cmd"')
****filepath = os.path.realpath(__file__)
****cmd = 'cmd /k "python %s"' % filepath
****os.system(cmd)


#正式代码开始
for i in range(10):
****print(i)
@also24 #35 我有一次在饿了么出现一份普通盖码饭花了 30 多元的情况。那个店平时都有满减,盖码饭原价 30 多,满减后就是 13 元的样子,实际就算实体店也是只要 13 的样子,故意提高价格再满减的,就是一份很普通的盖码饭。

然后我点完后过了一个月才发现扣了 30 多元。但是我平时下单一般在订单页面以及支付宝付款页面都会看的,我不敢相信我会这么大意。但支付宝里面也显示是 30 多元,所以饿了么不太可能联合支付宝这样,所以应该是我真的大意了。

不过倘若平台真的有这种买前及买后显示的价格不一样的情况,事后你真的没法证明,因为不可能下单时录视频。饿了么好歹有支付宝,美团就是自带的支付,他完全可以改任何数据。
@also24 #35 你举的例子正好就证明了正常用户也可能下单并出现跟自己买前看到的物品不一致的情况。
即便是爬虫程序,在最终支付的时候肯定也会再次判断当前页面的内容的,一个页面一个页面来的,跟正常用户差不多。

你说的情况 6,这个一般没平台会这么做,但倘若消费者真遇到了,那可能要自认倒霉了。虽说不太可能出现这种情况,但不知道程序会不会有类似意外(或不能复现的 bug )或者内部人员进行非法操作但查不到之类的。

举个例子,你用网银转账 1 万,你转账前看得清清楚楚就是 1 万元,但转完后查看交易记录发现转了 10 万元。银行坚称是你自己转了 10 万元,你根本就没法证明你只转了 1 万元,因为你不可能全程录视频。就算曝光后大部分人也会相信银行,他们会坚信银行的系统不会出错,没几个人会相信你。
@also24 #30 说实话,我以前玩梦幻西游,还用 python 写过收货脚本。
就是识别物品的图片,比如收购宝石就识别宝石的种类以及等级,是需要多次判断的。包括图片识别、文字识别以及判断价格的位数与物品是否匹配。不然一个 1 级宝石和 10 级宝石差别大了去了,比如 1 级宝石 6 毛钱,10 级宝石将近 300 元。一旦出错就是几百元损失。
@also24 #30 10 万只是举例,也许他愿意买 10 万的东西,只有买贵的东西才赚得越多,他觉得 10 万不算什么,但他设了 20 万的限额
@also24 #26 涉及到金钱支付的流程的时候爬虫也不傻,肯定会多次判断。确保页面的东西跟价格匹配才支付的。爬虫是去捡漏的,自然会有大量预先设好的数据,知道自己需要什么物品,知道什么物品值多少钱。只有当物品确实很便宜的时候才会购买。

我前面说了是返回污染的数据,但这个污染的数据是改了图片。所有不管是爬虫还是正常用户都知道这个物品的确是值 10 万的。所以如果误伤了正常用户,那正常用户也会认为这个东西值 10 万,也可能买。

这不是退不退还的问题。如果说自己买前看到的东西与最终付款后订单中显示的东西不一样,那说明这个网站有漏洞或者完全没有信誉可言,用户也可能去网上曝光。况且虽然是误伤,但网易可能依然会认为用户是爬虫,并且坚持价格没问题。
@also24 #21 也可能误伤正常用户,一旦被曝光,后果很严重。 如果反爬真那么厉害,能 100%不会误伤,那为什么现在很多网站还在正常用户访问网站的时候动不动弹验证码。
@also24 #16 比如装备,一个几十元的垃圾装备和十万的装备,肯定属性不同。用户可以根据属性了解到这个装备值十万,程序也可以通过预先设定的数据判断这个装备值十万。所以真人与程序并不会有什么差别。所以完全用不着举几百元的例子,有些装备的价格差距就是很大的。
像携程的买火车票应该也是爬虫吧
@also24 #10
我的意思是正常用户看到的价格就是十万,并且他愿意支付十万。因为正常用户看到的商品的确是价值十万的商品,网易故意把价值几十元的商品的图片换成了价值十万的商品的图片。

虚拟物品显失公平或重大误解不太好判断。像梦幻西游的一些宝石、兽决之类的比较好判断,但装备和角色比较难,不过价格差距太大应该还是可以的。

搞不好算欺诈或诈骗也是有可能的,爬虫者照样受消费者权益保护法保护。
再说爬虫一般也是模拟人工而已,同样都是网络请求( get 或 post 请求),你返回错误的数据就是你的问题了。就好比某人用了一个自己开发的从来没有人听过的浏览器访问藏宝阁,难道你就要返回错误的数据吗?并没规定一定要用某个知名浏览器,并没规定自己开发的浏览器就不能用。
最后,现在并没有任何法律明确规定爬虫是违法的,很多大公司照样在用爬虫。另外还有一些股票交易软件之类的也可能用到。只是法律自由裁量权挺大的,有时候说犯罪就是犯罪了,说不是就不是。
怎么证明是爬虫?服务器那边的数据网易想怎么伪造都可以。既然针对爬虫用户可以这样,那针对正常用户是不是也可以返回污染数据?反正事后用户没办法证明自己看到的是污染数据。

另外几十元的东西卖家本身也是标价几十元,但网易故意给出十万的价格,爬虫者付款到网易平台,最后多出的钱由网易私吞吗?怎么着也是不当得利了吧!
2021-03-04 21:00:59 +08:00
回复了 996bujiaban 创建的主题 程序员 不懂就问,图床靠什么盈利?
@liuxey #10 有一定效果,特别是比如涉及到色情的刑事责任这一块。警方看到了想抓人势必会更慎重,因为本身责任应该由上传图片的用户承担的,如果没有这种声明可能就直接抓人了。
不过这种事也说不准,比如快播。就算有声明也不代表就能完全避免风险,特别是个人网站以及小公司就风险越大。一般越是大公司就风险越小,bat 之类的大公司才能 100%免于风险,一般在法律界定不清的情况下不可能去大公司抓人的。
网站真的没盈利吗?看到有会员、赞赏以及付费课程。
如果只是爬取了目录应该问题不大,只是真的没有视频课程吗?
比如 http://ctc.koogua.com/course/1340 的第一个视频是可以播放的,其他需要购买。并且可以正常提交订单和付款,要是真有人提交订单后还看不了,是想搞诈骗吗?并且网站也被搜索引擎收录了
@brader #231 跟 cdn 有什么关系,你只是给源码给对方就行,楼主也没说要一条龙服务。最多说下怎么使用,上传到服务器之类的都是对方自己操作。
@wr516516 #221 包括后台,如果只是静态页面是有专门的下载工具的
@EKkoGG #206 你不信自己去淘宝问吧,php 开发的东西本来就便宜,况且又不是从头到尾开发,都是现成的东西改一改。
1 ... 111  112  113  114  115  116  117  118  119  120 ... 150  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1060 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 19:20 · PVG 03:20 · LAX 11:20 · JFK 14:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.