V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Morriaty  ›  全部回复第 2 页 / 共 28 页
回复总数  545
1  2  3  4  5  6  7  8  9  10 ... 28  
@Vegetable 没玩过生产环境的 flask ,请问这里的 100 个 worker 是相当于 100 个 process 吗?相当于 1req/s/pro 这也太跌破我想象了🤣
你要是没接触过,就别纠结 CPU GPU 的问题啊,先把 numpy 、torch 、transforms 这些库搞熟
@pipapa 哦哦我还以为是专门用于推荐设计的算法,类似于 DIN 之类的,难怪我查不到🤣
目前主流的大模型都是高维度 embedding ,维度之间本身就是默认正交的,简单理解,假设有个低维 128 维度的 embedding ,我可以手动组合 d1d2 组合维度作为 d129 维,再手动组合 d1d3 组合作为 d130 维,这是交叉特征 FM 的思想。只不过在深度神经网络时代( bert )之后,手动组合特征变成了直接设置为高维度 embedding ,让网络自己去学习这种“特征组合”。


@zhusimaji 另外请问下,MHA 全称是啥,挺感兴趣的,但我没查到
联想到了《刘擎西方现代思想讲义》里的内容,源自赛亚·柏林

>> 消极自由( free from sth )简单的说就是,我不想要什么就可以不要什么;积极自由( free to do sth )是我想做什么就可以做什么。换句话说,就是前者是摆脱障碍的自由,一个是实现目标的自由。消极自由容易被自己滥用,积极自由容易被别人绑架。
104 天前
回复了 v2li32 创建的主题 问与答 如何实现简单的推荐系统求助
github 上搜 recommend system ,不有一堆吗,
https://github.com/recommenders-team/recommenders/tree/main ,微软的,看着偏完备一点
https://github.com/chyikwei/recommend ,个人的,看着偏 demo 一点
侠客风云传
106 天前
回复了 shubiao 创建的主题 问与答 怎么把大模型微调成文本分类模型?
你是做的 few shot instruct 还是 prompt tuning ? 如果是 few shot , 这种方式效果不稳定。简单来说,few shot 不更新模型参数,prompt tuning 会更新模型参数。可以看看 peft 库
回来自答下,以便后来者能查看。
经过一番查找,目前找到的最符合我初始需求的是[tsalib]( https://github.com/ofnote/tsalib)
例子如下
<script src="https://gist.github.com/Morriaty-The-Murderer/c621922429d1f6b4a91ed1fdc97798e3.js"></script>

其中也结合了 2L 提到的`einops`,其实`tsalib`本身是自带类似的`warp`操作的,但由于`tsalib`本身很久没维护了( last commit 4years ago ),所以操作 tensor 还是选择了目前稳定维护的`einops`,仅保留了`tsalib`的`type annotation`

由于我也是刚开始使用,所以不太清楚这样子写是否是 best practise ,还在摸索中。
127 天前
回复了 xuqiccr 创建的主题 MacBook MacBook 的音量调节显示🚫是咋回事呢
spotlight 全局搜索( cmd+space )声音输出,把输出改成 Mac 扬声器
133 天前
回复了 zshineee 创建的主题 Java 请教一个 Java 查询 elasticsearch 的问题
The time reported by elasticsearch in the "took" field is the time that it
took elasticsearch to process the query on its side. It doesn't include

- serializing the request into JSON on the client

- sending the request over the network

- deserializing the request from JSON on the server

- serializing the response into JSON on the server

- sending the response over the network

- deserializing the response from JSON on the client
@killva4624 文明 5 吃配置

武林群侠传、太阁立志传这种老游戏都挺好玩,还能反复二轮三轮不重样,基本上 4G 内存就够了
147 天前
回复了 hoseawu 创建的主题 程序员 现在做全栈是不是一个好方向
还以为是老帖,下意识的看了下发帖时间🤣

工作了四年还能有如此纯粹的热情,挺好的。个人建议专而精比大而全要好。
154 天前
回复了 Q9K 创建的主题 Elasticsearch 关于 elasticsearch 机器的选择
你得说清楚:
1. 具体是什么查询,单 term query 和复杂的 bool + function_score 查询,差别大了去了
2. 数据结构是啥样的
3. 只读还是同时读写
4. 全靠 es 抗,还是程序层会做缓存
开发环境不就是装个 IDE ,剩下的的都交给 IDE 吗🤣又不是调试和部署
156 天前
回复了 wangxinpier 创建的主题 数据库 自动生成数据库数据的工具?
百度、google:ORM+fake data
156 天前
回复了 xianbing278 创建的主题 户外运动 求推荐一个登山/徒步鞋
200~300 就去迪卡侬挑,哪个合脚穿哪个
https://support.apple.com/zh-cn/HT204609
打开 Mac 触控板的三指轻触拖拽功能
1  2  3  4  5  6  7  8  9  10 ... 28  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   765 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 20:53 · PVG 04:53 · LAX 13:53 · JFK 16:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.