考虑到现在检测也不做了,最近各地疫情到底什么程度了,没有什么可以衡量风险的指标了,想搞一个网站,阳了的人可以顺手点一下,做个计数,每天可以统计全国各地细分到街镇的新增数据,以及新增趋势,从而得到一个风险系数。
逻辑很简单,只是计数,按天按地点 group by ,提供一些曲线和地图热点,匿名,只根据 ip 去重
不知道有价值不,或者是不是已经有类似的了
1
swulling 2022-12-11 00:27:06 +08:00 via iPhone 9
中国版的约翰霍普斯金大学统计么
小心被境外势力利用啊,就像上述统计被我党利用一样 |
2
bjzhush 2022-12-11 00:27:47 +08:00 1
统计数据有价值的一个前提就是采用一些方案或者逻辑保证收集数据的合理性以及消减误差。
但是你这种统计方法,得到的数据随机性和偏差估计都比较大,所以个人认为价值不大,除非达到一个巨量的数据集合 |
3
matthewgao OP @bjzhush 不追求完全合理性,那毕竟不是民间力量可以的,只想给个模糊的趋势
|
4
qinrui 2022-12-11 00:35:42 +08:00 via iPhone
阳的人不点怎么办?不阳的人点了怎么办?
|
5
matthewgao OP @swulling 那做不到,只是个简单的参考趋势而已,不过突然觉得用公网 IP 做去重有点问题。。
|
6
olaloong 2022-12-11 00:40:00 +08:00 via Android
啥校验也没有,太玩具了,不比直接瞎编数据靠谱多少
|
7
matthewgao OP @qinrui 所以这里其实关注的是概率,并不是绝对数字
|
8
leloext 2022-12-11 00:49:59 +08:00
想问一个问题:同一个人用各地代理刷怎么排重呢?
|
9
EminemW 2022-12-11 01:07:19 +08:00
加个设备指纹校验吧
|
10
cnrting 2022-12-11 01:10:42 +08:00 via iPhone
快进到被封
|
11
matthewgao OP @leloext 其实我考虑这个问题更多的是从概率的角度,就是他总归是有各种噪音的,如果有效内容足够多,则噪音就可以不管他,另外这个东西绝对简单,不涉及任何利益和可盈利的点,所以会假设这种动机也很少,当然肯定是有就是故意破坏的,所以这点上确实,但是呢 又不想加太多的校验内容怕降低参与意愿,最多有个校验码,但是这种我觉得都会降低人参与的意愿
|
12
uov 2022-12-11 01:33:12 +08:00 via Android
可邢可拷
哈哈😃 |
13
pengpengpeng 2022-12-11 02:18:56 +08:00
我有个绝美匹配的双拼域名,可惜怕被搞 hold 了, 算了。
|
14
molezznet 2022-12-11 03:05:49 +08:00 2
主要问题是网络民意真的只代表少数
虽然网民多 但是愿意发表的不多 所以我还是比较认同网络民意只是少数 结论:p 没有统计学意义 |
15
locoz 2022-12-11 03:12:23 +08:00
然后就会有人莫名其妙出于找乐子之类的心态,对数据进行大量投毒,并主动或暗中观察或煽动说 xx 地方怎么怎么样,然后你的网站被封、人被请去喝茶。类似的事情又不是没有发生过,无法验证的“统计”数据除了被人利用以外没有任何实际价值。
|
16
zxCoder 2022-12-11 08:40:24 +08:00
@matthewgao "如果有效内容足够多" 这个很难实现的
|
17
Track13 2022-12-11 09:39:06 +08:00 via Android
我看你是想去美国申请政治庇护了。肯定会被刷。
|
18
zhw2590582 2022-12-11 09:51:55 +08:00
你不怕有人写个脚本,疯狂地刷我阳了?
|
19
zxCoder 2022-12-11 10:21:09 +08:00
都不用扯什么政治的,你甚至可以试着在 v2 发个匿名投票,(看选"吃屎"的人多不多
|
20
qinrui 2022-12-11 11:01:12 +08:00
@matthewgao 你莫不是对概率有什么误解
|
21
tomari 2022-12-11 11:38:18 +08:00
小心被当成境外势力抓起来
|
22
luckykong 2022-12-11 12:21:52 +08:00
对于这类问题,经济学、管理学领域付出了极大极大的努力,想得到一个“有效内容足够多”的样本,但依然没有令人满意的结果。
你这个方法,就像他们一样,只能拿到一个“包含有效内容”的样本。至于里面有效内容有多少、噪音比例多少、如何提取出来有效内容,都是无法解决的问题。 你这个做法,第一个问题就是样本是不是随机抽样。你不用做,我都能猜到北上广深重阳了的人做多。三线城市没几个阳了的。 这个样本可信么?这完全受不同地方互联网发展程度的影响啊。 |
23
sunwayTaihulight 2022-12-11 15:11:18 +08:00 1
我有个想法:就是直接爬各地发热门诊的空余挂号数,观察是否富裕或挤兑。
现今确诊数意义已经不大,但发热门诊的挂号量可以同时反映“病例数量级”、“病毒的毒力程度”、“医疗挤兑程度”。 |
24
imldy 2022-12-11 15:13:21 +08:00 1
|
25
calloc 2022-12-11 17:34:58 +08:00 via iPhone
更新状态领红包
|
26
20015jjw 2022-12-11 17:38:14 +08:00
这不就是 down detector 吗
|
27
7Sasuke7L 2022-12-11 20:01:39 +08:00 via iPhone
首先这个统计的实际价值不大,而且很多人并不知道你的网站,因此别人阳了,也不去你的网站专门点击一下。有人没有阳,也可以去点一下,最后得到的数据我实在不知道能干什么。数据的收集,准确性不能保证,也没什么用。
|
28
Exdui 2022-12-11 21:01:56 +08:00
现在阳的人一般会在社交 APP 分享,从几大社交平台爬虫数据反而更靠谱一些。
|
29
seansong 2022-12-12 14:21:04 +08:00
制造焦虑并不是一个好的主意
|
30
Youkochan0v0 2022-12-12 21:58:51 +08:00
这完全不靠谱啊,阳的人未必知道你的网站,知道你的网站的人也有办法一直刷数据
|
31
iceteacover 2022-12-13 18:16:26 +08:00
有些微博大 v 和 公众号在自己的粉丝中查看阳性比例,我看到过 2-3 个,比例都差不多 阴阳比 2 比 1 2022.12.12
|
32
nmap 2022-12-13 20:41:20 +08:00
属于国家机密了,只能官方公布,咋没点敏感性呢
|
33
game159 2022-12-14 13:23:54 +08:00
我看刑,很有判头。
|
34
uov 2022-12-21 00:28:38 +08:00 via Android
想吃捞饭
|