V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  noahlias  ›  全部回复第 3 页 / 共 7 页
回复总数  123
1  2  3  4  5  6  7  
985 其实也差不多 有的专业老师就是读概念 和 ppt 实践太少了

就 cs 来说 对比 老外的一些公开课 我觉得国内很多老师都是不作为的, 比如操作系统这门课,我大学根本就没讲怎么做一个完整或者实验的操作系统 基本就是一些概念 , 我都不知道实际编程中到底是如何操作的 根本激不起我的兴趣 也导致很多年后我基本忘了这么课到底讲了啥
体外话 :我们当时都没上机体验过 linux ( linux 还是我后来在工作中学习的),另外这是一门必修课 (信息管理信息系统专业 不是 cs 科班)

虽然现在也有很多优秀的老师比如 jyy 在致力把这种差距减小 ,但是你也看到了教学水平还是有差距的
你说的是可是这种类型?

https://github.com/abi/screenshot-to-code
你说的是实体抽取?
这个 nlp 出来的时候就有了 只不过现在的大模型让这个任务更简单了
你说的是 github copilot cli 吗
35 天前
回复了 frostming 创建的主题 Python 有一个包管理器叫 PDM,已经四年多了
让我想起了年初看的一篇文章
https://chriswarrick.com/blog/2024/01/15/python-packaging-one-year-later/
加上之前看过的 https://alpopkes.com/posts/python/packaging_tools/
基本介绍了 python 的包管理的复杂生态和一些令人诟病的地方

我觉得官方没有下手也是主要原因, go/rust 这些官方的包管理工具哪个不比 python 的好(手动🐶
@AoEiuV020JP 我看了一下 因为阅读模式确实 他的确没有解析出来一些结果
https://i.imgur.com/veVXBu6.jpeg

这让我确信它确实用到了一些 html 的 parser
但是当你用一个插件 ( https://chromewebstore.google.com/detail/kimi-copilot-%E7%BD%91%E9%A1%B5%E6%80%BB%E7%BB%93%E5%8A%A9%E6%89%8B/icmdpfpmbfijfllafmfogmdabhijlehn)
结果效果相当好
https://i.imgur.com/FQH0xIU.jpeg

但是当你深入问一些详细信息的时候 说明 parser 还是不够好 因为它是读取 html 进去的一些表格信息并没有正确排列
https://i.imgur.com/16JSapK.jpeg

另一个 elmo.chat 它应该是利用了生成的 html 但是详细信息 也是没识别到在乱说
https://i.imgur.com/Zzc5BU2.jpeg
dnd 风格的吗
看起来是 azure 的 tts
其实帖子筛选 不就是文本分类吗 用大模型有点大材小用了,这种你们社区不应该由自己的评分机制吗
比如点踩 访问量等各种指标 来判断优质和低质 有必要几千万的去判断吗?
至于第一个 这个用大模型做一个检索增强生成(RAG) 就可以了 而且是针对用户的 也没那么高请求
39 天前
回复了 xing393939 创建的主题 Python yield 和 return 混用的问题
If the compiler detects the yield keyword anywhere inside a function, that function no longer returns via the return statement. Instead, it immediately returns a lazy "pending list" object called a generator


https://stackoverflow.com/questions/231767/what-does-the-yield-keyword-do-in-python
39 天前
回复了 loyth06 创建的主题 职场话题 关于外包经历的一个疑问
曾经觉得中国人口数量多是一个优势

现在越来越发现 人口数量是一个就业的巨大劣势
是我的错觉吗?
@SayHelloHi 这个不一样好吗 这个是用 metasearch +webarchive 来获取搜索信息的 它等同于搜索引擎
而且需要你部署一个服务 也不是实时的 而且它只获取了网站的 snippet 和 bing/google 这些搜索引擎 API 返回的结果差不多 然而你要获取网站的大纲和详细信息 一定是要用到 html parser 的
官方描述的是 第三方抓取 网页等
```
是否开放类似 Kimi 智能助手中的搜索接口?

目前并没有开放搜索的计划,API 用户可以使用例如 Apify 、Crawlbase 或者 ArchiveBox 等第三方解决方案。
```
但是之前看同类型 elmo.chat 介绍类似的技术方案的时候 html parser 用的是阅读模式
( https://github.com/mozilla/readability)

详情可以看这个技术方案介绍
https://x.com/yadong_xie/status/1774672630194520283
你要想到一个问题 中国人的基数 有白嫖的话 这个成本会很大
而且很容易链式反应 马上就传播了 厂商就要做各种防薅策略哈哈
@Pters 搜了一下并没有机器的网络和 io 有个进程
https://github.com/search?q=repo%3Ajxxghp%2FMoviePilot%20psutil.&type=code
40 天前
回复了 rookiemaster 创建的主题 OpenAI 如何测试 gpt 的版本
可以参考这个 https://nicholas.carlini.com/writing/2024/evaluation_examples/index.html

这上面的问题都很有意思哈哈哈 我第一眼看到的是这个问题
https://nicholas.carlini.com/writing/2024/evaluation_examples/python_to_c_loop_update.html

AI 都是大笨蛋
又是这个法国人, 这个人可以说是计算机科学的神了, 现在开始搞 AI 了是吧
我觉得 你这种是 corner case 多行注释 行内注释呢 不规范注释呢 比如
```python
'''
hello world
'''
# type:ignore



print("hi") #hi
```
应该怎么展示呢 中间有 blank line 呢 还得考虑统一编码风格
讲个笑话 美国地址生成器生成的地址竟然真的能用
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4455 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 10:00 · PVG 18:00 · LAX 03:00 · JFK 06:00
Developed with CodeLauncher
♥ Do have faith in what you're doing.