V2EX › Dark1X 的所有回复 › 第 1 页 / 共 1 页

@ochatokori 感谢
我在测试的时候发现爬虫不加这个签名参数也是可以的。
现在的问题是浏览器上面获取的的数据与爬虫获取到的数据不一致。你有空的话复现帮我看看呀，麻烦了。
浏览器访问： https://删除这几个字 wk588.com/tools/kuangjiduibi
爬虫源码：
```
#!/usr/bin/env python3
# coding=utf-8

import requests
import json
import re

def getPage(url):
response = requests.get(url=url)
return response.text

if __name__ == '__main__':
headers = {
'User-Agent':'Mozilla/6.0 (X11; Linux armv7l) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.84 Safari/537.36',
'Accept-Encoding': 'gzip, deflate, sdch',
'Accept-Language': 'en-GB,en-US;q=0.8,en;q=0.6'
}

jsonData = getPage('https://删除这几个字 wk588.com/tools/json/qbkuanjiapi.php?n=Bitcoin&dj=0.4&_=1557106802754')
#print(json.loads(jsonData))
minerInfoList = json.loads(jsonData)['data']

# 矿机名称列表
nameList = []
# 算力列表
hashRateList = []
# 功耗列表
powerConsumptionList = []
# 能耗比列表 HashPowerConsumptionRatio
hpcRatioList = []
# 日产值列表
dailyEarnList = []
# 日电费列表
powerChargeList = []
# 电费占比列表
powerChargeRateList = []
# 每日净收益列表
dailyRetainedProfitList = []
for miner in minerInfoList:
if miner['sh'] == 'SHA-256':
minerName = re.sub('<\w.*?\s.*?>.*?','',miner['name'],2)
nameList.append(minerName)
hashRateList.append(miner['kjsn']['xs'])
powerConsumptionList.append(miner['kjgh']['xs'])
hpcRatioList.append(miner['kjdwgh']['xs'])
dailyEarnList.append(miner['rcz']['xs'])
powerChargeList.append(miner['rcdf']['xs'])
powerChargeRateList.append(str(miner['dfzb']['sz'])+'%')
dailyRetainedProfitList.append('￥'+str(miner['rcsy']['sz']))

print(len(nameList))

for i in range(len(nameList)):
print('%-20s' % nameList[i] + '\t' + hashRateList[i] + '\t\t' + powerConsumptionList[i] + '\t\t' + dailyEarnList[i])
```

2019-05-06 10:39:51 +08:00

回复了 Dark1X 创建的主题 › 问与答 › AJAX GET 请求 URL 最后面缀的那个类似于时间戳的参数是什么啊？

@ochatokori 感谢
我在测试的时候发现爬虫不加这个签名参数也是可以的。
现在的问题是浏览器上面获取的的数据与爬虫获取到的数据不一致。你有空的话复现帮我看看呀，麻烦了。
浏览器访问： https://wk588.com/tools/kuangjiduibi

2019-05-06 10:19:28 +08:00

回复了 Dark1X 创建的主题 › 问与答 › AJAX GET 请求 URL 最后面缀的那个类似于时间戳的参数是什么啊？

我理解这个数字是为了防止浏览器缓存用的，只是不知道这个数字是在什么时候加上去的？
猜想：是 jQuery 自动加上去的吗？
追问：
1. 这个类似时间戳的数字的生成逻辑在哪里、在 Python 爬虫里这个数字的值该如何构造？
2. 在 Python 爬虫中我尝试了随机修改这个数字，发现与浏览器获得的数据还是不一致。爬虫获取数据的时间与浏览器获取数据的时间相差不到 10 秒，而且我在短时间内再次刷新浏览器页面，发现两次刷新浏览器页面呈现的数据没有变化，所以排除在爬虫获取数据期间与浏览器获取数据期间服务端后台数据发生变化的可能。

2019-05-06 10:13:51 +08:00

回复了 Dark1X 创建的主题 › 问与答 › AJAX GET 请求 URL 最后面缀的那个类似于时间戳的参数是什么啊？

我用 Chrome 和 Firefox 也发现 URL 后面会自动追加这个数字了。

2018-11-10 19:02:28 +08:00

回复了 372559970 创建的主题 › 问与答 › 有百十台搬砖电脑，现在游戏不行了，想问问各位大神有别的用电脑挣钱的项目吗？

显卡 ok 的话找个电便宜的地方挖矿

2018-11-10 15:01:26 +08:00

回复了 anyele 创建的主题 › 问与答 › Windows10 下，有 Clover 的代替品吗，真的受不了了

Explorer++