V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sujin190  ›  全部回复第 16 页 / 共 123 页
回复总数  2449
1 ... 12  13  14  15  16  17  18  19  20  21 ... 123  
2023-06-27 12:00:28 +08:00
回复了 heycn1 创建的主题 问与答 关于微信小程序「手机号快速验证收费」大家怎么看?
@kaedeair 大多数人用的应该是快速验证,那还是便宜一些的吧,发送短信验证码量大想保证实时性和送达率估计不大可能低于阿里云这个价格了吧
2023-06-15 09:52:54 +08:00
回复了 jameskongawork 创建的主题 问与答 应试教育把人都学傻了。
我看这不是应试教育有问题,是人有问题,你这想法也有问题,善于探索善于学习本来就不是每个人都是这样的,守于环境才是大多数人会干的,再说吧一教就会一看就懂的全才那种你觉得你有机会和他们做同事么
你说的这个叫代理
2023-06-14 11:11:26 +08:00
回复了 brainzhang 创建的主题 奇思妙想 能否建立一个的 AI 训练众包平台
数据安全也是一个很大问题,训练用的数据可都是各大公司的资产,云厂商可以通过签署合同承担责任,个人用户你没法约束他而且也不稳定,而且把现在普通显卡和专业超算算力差距会越来越大,大概率得不偿失

再说吧复杂模型必须只能是大厂商巨额投入才能玩得动的,否则如何建立护城河,越是难以进入的领域就代表着越高的回报,资金对于他们来说完全不是问题,所以这个的发展方向只会是更大更贵更复杂
2023-06-07 15:03:47 +08:00
回复了 voids 创建的主题 程序员 有没有老哥做过数仓或者数据中台,请教个问题
这事看起来没啥复杂的,就是累人,图表显示还好,既有开源系统可以用各种云厂商也有,收集数据确实麻烦,一般也不标准化,或许可以看看各种 pra 工具能不能搞搞
2023-06-05 23:25:42 +08:00
回复了 ben548 创建的主题 Go 编程语言 local cache 需要在集群的服务器之间做同步吗?怎么做?
@ben548 本地缓存要么是很长时间不变的,比如各种 secret ,或者集群状态缓存之类不断上报的,要么是读取频率超高,比如数十毫秒过期还能有 10 比 1 命中率的,否则没啥用的价值,redis 缓存怎么也得有 4 比 1 的命中率才有用的价值吧,否则一味搞缓存真的是负优化,纯粹就是给自己找麻烦
2023-06-05 23:15:04 +08:00
回复了 ben548 创建的主题 Go 编程语言 local cache 需要在集群的服务器之间做同步吗?怎么做?
@ben548 太脆弱,如何保证肯定不出错是个问题,有个变更事件没接到或者挂了想再一致太难,缓存的作用是在超大量的时候提高大部分效率,而不是在小流量下加速所有请求,这种没意义,本地缓存的真正价值是读取延时纳秒级,就算过期时间 10 毫秒,假如每秒 10000 次调用,其加速也是巨大的,如果每秒 10 次调用,你再怎么搞也毫无意义,redis 延时毫秒级,数据库几十毫秒,你本地缓存搞个分布式不是把纳秒级延时生生搞到毫秒级了么,这完完全全是负优化,别钻牛角尖啊
2023-05-31 09:54:51 +08:00
回复了 mythjava 创建的主题 问与答 请教一个关于 Python ast 的问题
@TtTtTtT #14 通用沙箱 python 这种想对性能影响不大确实不容易,但看楼主需要似乎做的是类似 Google colab 的服务,应该是需要在调用特定算法库或者访问网络磁盘计费,这种就还好了吧,毕竟静态编译的 ast 分析分歧小但是加钩子还挺麻烦的,python 加钩子拦截可就容易的很了,安全调用和 cpu 内存限制其实放给容器或者其他通用沙箱环境就好了,没必要在 python 层面弄吧,毕竟系统层面弄这些可比 python 层面弄这些容易多了性能损失也最小
2023-05-31 09:44:22 +08:00
回复了 f1ynnv2 创建的主题 Python 多进程使用 logging 把日志存储到不同文件的实践
@f1ynnv2 #10 确定不是写的问题,我们十多个进程每天写入数十 G 的时候没发现有错行的问题,也这样运行好多年了,没发现啥异常
2023-05-31 09:30:41 +08:00
回复了 f1ynnv2 创建的主题 Python 多进程使用 logging 把日志存储到不同文件的实践
https://gist.github.com/snower/adcf300f3daff99549dbe1949982a5dc

我们项目就是重写了 doRollOver ,使用文件锁来处理,这样就算多个进程是独立创建的也没有问题,只是似乎不能在 windows 上用,而且这个函数只有在需要重新创建日志文件的时候才会调用,正常写日志的时候不会有影响,所以也没啥性能问题
2023-05-31 09:25:33 +08:00
回复了 f1ynnv2 创建的主题 Python 多进程使用 logging 把日志存储到不同文件的实践
如果你日志是有时许的,每个进程写单独文件,看日志的时候还不累死了,不就是时间的文件归档有问题么,修改下 doRollOver 加个锁就是了呗,也不是啥麻烦的事情
2023-05-30 16:33:54 +08:00
回复了 mythjava 创建的主题 问与答 请教一个关于 Python ast 的问题
@mythjava 那我猜你需要计费的代码应该是 numpy 和 pytorch 这样重数学计算库,或者大量文件和网络请求吧,参考 gevent monkey patch 的思路做拦截计费就行吧
2023-05-30 16:14:41 +08:00
回复了 mythjava 创建的主题 问与答 请教一个关于 Python ast 的问题
@mythjava 提取出来用途是啥? python 好多都是运行起来才知道的,静态分析还是有限,如果想有限运行,那还不如搞沙箱来的容易一些
2023-05-30 14:42:46 +08:00
回复了 mythjava 创建的主题 问与答 请教一个关于 Python ast 的问题
@TtTtTtT #3 加上闭包动态属性什么的一周都不一定能搞定吧

说不定还是直接运行一下然后通过 trace 追踪一下那些行被调用了实现起来更快呢,话说你干嘛呐?多余的代码就多余呗,耗点性能也无所谓吧
@julyclyde #13 是的,需要 pip install sevent
python -m sevent.helpers @arproxy -p 80 -T none @arproxy -p 443 -T none

一条命令行就可以,不但会解析 sni ,普通 http 还会解析 header 通过 HOST 字段提取域名,如果你还有上级代理得话也可以指定转发到上级代理来访问

如果你已经有代理了话,其实可以不需要再境外 VPS ,指定 hosts 后,通过 iptables 重定向流量到命令行启动的端口,然后再转发到代理就好了
2023-05-24 14:48:51 +08:00
回复了 7911364440 创建的主题 程序员 问个分布式事务的问题
或许可以更粗暴点,从 RocketMQ 收到消息通过新的交换机再次发送 RocketMQ 各个不同的数据源队列去,然后各数据源各自消费者,反正不成功消息不会从队列消息,自动就有重试
1 ... 12  13  14  15  16  17  18  19  20  21 ... 123  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2532 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 10:57 · PVG 18:57 · LAX 02:57 · JFK 05:57
Developed with CodeLauncher
♥ Do have faith in what you're doing.