V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wxf666  ›  全部回复第 5 页 / 共 27 页
回复总数  529
1  2  3  4  5  6  7  8  9  10 ... 27  
312 天前
回复了 arielcc 创建的主题 云计算 夸克网盘个死不要脸的狂写硬盘
@arielcc 楼主追踪看看,读写了哪些文件?

目前我只知道可以用 sandboxie 做到,可参考 25 楼,

当时追踪了更过分的微力同步,只是获取了文件目录,就读写了 几百 GB 的垃圾数据库 index-v0.14.0 。。
312 天前
回复了 arielcc 创建的主题 云计算 夸克网盘个死不要脸的狂写硬盘
@yukinomiu #33 看来电脑用大内存还是很有必要的。省得那些软件公司天天转嫁成本给自己。
发布会不是说可以支持吗?当时好像还有人说,能根据设计图,生成全套前端工程来着?
312 天前
回复了 arielcc 创建的主题 云计算 夸克网盘个死不要脸的狂写硬盘
@yukinomiu #30 如果 25 楼采用你说的,放进虚拟机里运行,限制硬盘容量和 IO 速度,估计只会有以下结果:

1. 下载很慢

天翼云盘就是要分 18W 份下载,每一份就是要先丢到临时目录,最后再合并。

还要写 66W 次数据库。限制速度不会让它跳过这些步骤。


同理,微力同步也一定要预先构建 15 GB 的数据库。

我尝试丢到过树莓派上运行,看是不是 Windows 端的问题。

结果就是更慢,但该写的数据,一个 Byte 都少不了。。


2. 下载失败

我建立了内存盘,设置 sandboxie 重定向对 C: 盘的操作到内存盘,D: 盘的正常放行。

设立过小时,这俩软件都说空间不足。。
312 天前
回复了 arielcc 创建的主题 云计算 夸克网盘个死不要脸的狂写硬盘
@yukinomiu #3 楼主是心疼新硬盘被不合理地乱干,虚拟机防不了这个吧?
312 天前
回复了 arielcc 创建的主题 云计算 夸克网盘个死不要脸的狂写硬盘
也有可能只是软件设计得垃圾。我以前用 天翼云盘 和 微力同步 时碰到过。


1. 天翼云盘,在下载一个 4GB 的文件时,保存目录在 D: 盘,但 C: 盘也有 40 GB / hour ( 12 MB/s ) 的速度写入。

用 sandboxie 跟踪文件操作日志,并分析数据,发现有 170W 次文件操作:

- 4GB 的文件被分了 18W 份进行下载,每一份先下载到 C: 的临时目录
- 反反复复开事务写一个 52 KB 的数据库 66W 次(导致反复创建删除 xxx.db-journal ,估计触发了很多 NTFS 的东西)
- 读写配置文件 47W 次(看不懂。。)
- 写目标文件 1500 次
- 还有个 35W 次的,对程序目录的操作,我看不懂。。

分析命令:

```shell
$ awk -F$'\t' -v OFS=$'\t' '$5 ~ /^File/{arr[$7]++} END{for (k in arr) if (arr[k] > 1) print arr[k], k}' sandboxie.log | sort -rn
666140 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud\transManNew_###########@189.cn.db-journal
470862 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud\setting.xml
353936 \Device\HarddiskVolume3\Program Files (x86)\ecloud
1544 \Device\HarddiskVolume9\??????\????????\????????.part11.rar
23 \Device\HarddiskVolume3\Program Files (x86)\ecloud\Config\ecloud\transfercfg.xml
22 \Device\HarddiskVolume3\Program Files (x86)\ecloud\eCloud.exe
18 \Device\HarddiskVolume3\WINDOWS\System32\drivers\etc\hosts
11 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud\setting.xml.tmp
11 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud
6 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud\LogFileTransfer_###########@189.cn.db-journal
4 \Device\HarddiskVolume3\Users\wuxun\AppData\Roaming\ecloud\userinfo.xml
2 \Device\HarddiskVolume9\??????\????????\????????.part11.rar.ecdl
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_ZNx3dAAodr46ERcahHyp
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_z84dXqNPNdgIWChWt1PM
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_Z2RJUJnPusih593Oxc9F
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_ylQaBzpTKmd9O7nXb447
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_XaAabe9g3PxVgRtbBPff
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_X2XEpRBBSfbNoRlXyCSa
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_VW5XBHbCfAMSHQboxLR0
2 \Device\HarddiskVolume3\Users\wuxun\AppData\Local\Temp\etilqs_uSrTPYjHvBhmRWHVahW7
……
```

当时 sandboxie 跟踪文件日志截图:

https://i.imgur.com/Wk219hM.png



2. 微力同步,在获取 zlibrary_cn 大概 36W 个文件的列表信息时,就要读写几百 GB 了(还没咋开始下载真正的文件内容呢)。

跟踪了下,发现只是在构建它的索引数据库 index-v0.14.0.db 。。(不知这数据库咋设计的,36W 个文件信息,就要存 15GB 。。)

当时正从其他 30 人获取文件列表信息:

https://i.imgur.com/XIVxdh3.png

任务管理器发现,这货库库读写 C: 盘:

https://i.imgur.com/Mq5nUGC.png
@yanqiyu #8 系统要多少内存才能维护 1T 虚拟内存来着?好像是操作系统的页表那块内容吧?忘完了。。
@hez2010 #86 其实也没太大所谓了。


首先,这几个编辑器里,确实也就 你的 和 vscode 好看些。赏心悦目嘛,自然要付出些代价。

而且,以后内存越来越便宜,多占点少占点也差不太多。

主要是我现在的笔电,内存是焊死的,加不了内存,我才比较在意。以后换电脑后,也就无关紧要了。

另外,这个也是未来的趋势,连微软都用 WebView2 来写一堆自带应用了。。


你的再加点点功能,当个日用编辑器也挺好的:

- 启动比 vscode 快
- 比其他编辑器好看
- 几十万行文本处理也不慢(至少比 Notepad++ 卡七八秒快),占用内存也可接受(几百 MB )

总之,技术也挺厉害的了,写的 demo 差不多也算是成品了 https://i.imgur.com/lG44yUl.png
@hez2010 #83 没有吧。。

vscode 右边的缩略图全部都染色了(刚打开文件,要等几秒钟才染色。之后随便疯狂拖滚动条都没事了)。

Notepad++ 的话,第一次滚动到文件末尾,确实卡了七八秒。但之后就能随便疯狂拖滚动条了。

Notepad--、Notepad Next 、QtCreator ,随便疯狂拖滚动条也没事,甚至还有层次折叠。

如果每次都只处理显示出来的代码,那怎么知道是不是在 /* */ 注释里呢?甚至还知道在哪个层次里,该层次有没有被折叠。。



另外,我发现 Notepad-- 甚至会解析 #ifdef 之类的宏块,未定义的块甚至会暗淡。。

如果在开头写个 #ifdef abcdefg ,结尾写个 #else /* else */ #endif ,那么就只有这四行深色,其他 25W 行都是浅色。。



好吧,所有应用都缓慢拖动滚动条,从顶至底,又回到顶部,反复十次。

尽量确保每一处代码都分析完毕并渲染过后,再测量内存:

| 应用 | 内存(最大化,反复缓慢拖动滚动条至两端十次,再静置至稳定) |
| :-----------------: | :--------------------------------------------------------: |
| Visual Studio Code | 510 MB |
| EditorDemo-Angle | 800 MB |
| EditorDemo-Software | 720 MB |
| Notepad++ | 30 MB |
| Notepad-- | 40 MB |
| Notepad Next | 50 MB |
| QtCreator | 440 MB |

不知为啥,你的内存占用还膨胀了。。

按理说,已经预先缓存所有高亮代码了,后面应该不会再涨内存了?(就像其他 5 个应用一样)
@documentzhangx66 #82 那么,那些号称体积小、占用内存小、性能接近原生的框架,发展方向错了?

比如,一个文本编辑器,应该大力宣传:

- 安装包 1GB+,但功能全面
- 内存占用 10GB+,但功能全面
- 运行较慢,但功能全面




另外,以后都 GPT 自动生成代码了,程序员的时间不值钱了

隔壁不是有个说,1 元钱,能自动生成全套包含产品文档、架构设计、代码的完整 repo 了么
@hez2010 #64 试了下:

| 应用 | 内存占用(启动后,最大化窗口为 1080P ,静置至稳定) | 内存占用(打开 sqlite3.c ,8MB ,25W 行,静置至稳定) |
| :-----------------: | :-----------------------------------------------: | :-------------------------------------------------: |
| Typora | 130 MB | |
| Clash For Windows | 110 MB | |
| Visual Studio Code | 250 MB | 450 MB |
| EditorDemo-Angle | 70 MB | 500 MB |
| EditorDemo-Software | 50 MB | 460 MB |
| Notepad--( QT5 ) | 15 MB | 35 MB |
| Notepad Next ( QT6 ) | 20 MB | 40 MB |
| QtCreator ( QT6 ) | 70 MB | 420 MB |

感觉内存占用差不多和 Electron 应用看齐。

论高效省资源,应该还得是 QT 应用。
314 天前
回复了 buf1024 创建的主题 分享创造 Flutter 编写的收音机桌面+手机端
@buf1024 #3 我碰到的情况是这样的,你看看可能是啥问题:

https://i.imgur.com/nIeTQCL.png
@DTCPSS #52 感谢指路。

体验了几个应用,感觉就像是 Win11 风格的应用。

另外,体积、内存、CPU 等资源消耗都变大了。比如(内存占用是刚开启的起步占用):

- 一个丑丑的播放器,体积 40MB ,内存占用 100MB+。

- 一个搜索软件,体积 160MB ,内存占用 200MB+。(应该没索引文件,因为搜索不到)

- 一个歌词软件,体积 460MB ,内存占用 100MB+

- 一个 UI 设计软件?体积 160MB ,内存占用 1GB+

感觉和用 Electron 应用差不多,笨重、软绵绵、不跟手
314 天前
回复了 buf1024 创建的主题 分享创造 Flutter 编写的收音机桌面+手机端
楼主你是不是在不断地切换 SQLite 的日志模式?

Windows 上,你的应用每秒写入磁盘 10 MB/s 。

追踪看了下,每秒写入这俩文件几百上千次:

- C:\Users\xxx\AppData\Roaming\buf1024\hiqradio\hiqradio\hiqradio.db-wal
- C:\Users\xxx\AppData\Roaming\buf1024\hiqradio\hiqradio\hiqradio.db-journal

按理说,这俩应该只会出现其一?
@everyx @hez2010 @DTCPSS 请问有哪些比较著名的 Avalonia 应用吗?想去体验一下
@chengxiao #39 Windows 上还有哪些 flutter 应用吗?想去体验一下
@locoz 我的朴素思路就是想跳过时不时插播的 澳 门 威 尼 斯 人 广告。

你能演示一下,如何让这个思路演变成,足以让它写出完美达到目的的代码?
@locoz #47 能让 AI 帮写一个,能识别视频站的 澳 门 威 尼 斯 人 广告,并自动跳过的代码吗?
315 天前
回复了 faketemp 创建的主题 分享创造 Json 数据通用提取工具[离线]
@faketemp #15 再试试 pandas 、dsq 、fx 这些,以及 dsq 提到的其他比较快的工具 octosql 、duckdb ( q 太大了,算了):

- **pandas**:总计 5.24 s ,实际 pandas 只用 3.85 s 。看来确实有点重量级,不太适合日常小型数据处理。
- **dsq**:5.30 s ,但是不支持 CSV 输出,是以 json 原样输出的。*(看时间统计,似乎是双线程?)*
- **fx**:很久,且占了 4GB+ 内存,直接中断了。。*(好像也不支持 CSV 输出)*
- **octosql**:不支持读取 JSON Array ,只能 JSON Object ?
- **duckdb**:4.61 s ,和 SQLite 差不多。

Shell 操作记录:

```shell
~/Downloads $ time py -c 'import time; import pandas as pd; begin = time.time(); pd.read_json(r"Y:\villages.json")[["code", "name"]].set_index("code").to_csv(r"Y:\out.csv"); print(f"{time.time() - begin:.2f}s")' && showCsv
3.85s
real 0m 5.24s
user 0m 0.00s
sys 0m 0.01s


~/Downloads $ time ./dsq.exe Y:/villages.json 'SELECT code, name FROM {}' > Y:/out.csv && showCsv
real 0m 5.30s
user 0m 8.81s
sys 0m 1.50s
619503 33905785 Y:/out.csv
{"code":"659011502509","name":"十一连生活区"},
{"code":"659011502510","name":"十二连生活区"},
{"code":"659011502512","name":"五连生活区"}]


~/Downloads $ time ./fx.exe Y:/villages.json 'x.map(y => [y.code, y.name])' > Y:/out.csv && showCsv
^C


~/Downloads $ ./octosql.exe 'SELECT * FROM provinces.json'
Error: typecheck error: couldn't create datasource: expected JSON object, got '[{"code":"11","name":"北京市"},{"code":"12","name":"天津市"},{"code":"13","name":"河北省"},{"code":"14","name":"山西省"},{"code":"15","name":"内蒙古自治区"},{"code":"21","name":"辽宁省"},{"code":"22","name":"吉 林省"},{"code":"23","name":"黑龙江省"},{"code":"31","name":"上海市"},{"code":"32","name":"江苏省"},{"code":"33","name":"浙江省"},{"code":"34","name":"安徽省"},{"code":"35","name":"福建省"},{"code":"36","name":"江西省"},{"code":"37","name":"山东省"},{"code":"41","name":"河南省"},{"code":"42","name":"湖北省"},{"code":"43","name":"湖南省"},{"code":"44","name":"广东省"},{"code":"45","name":"广西壮族自治区"},{"code":"46","name":"海南省"},{"code":"50","name":"重庆市"},{"code":"51","name":"四川省"},{"code":"52","name":"贵州省"},{"code":"53","name":"云南省"},{"code":"54","name":"西藏自治区"},{"code":"61","name":"陕西省"},{"code":"62","name":"甘肃省"},{"code":"63","name":"青海省"},{"code":"64","name":"宁夏回族自治区"},{"code":"65","name":"新疆维吾尔自治区"}]'


~/Downloads $ time ./duckdb.exe -csv :memory: "SELECT code, name FROM 'Y:/villages.json'" > Y:/out.csv && showCsv
real 0m 4.61s
user 0m 3.40s
sys 0m 1.15s
619504 22135235 Y:/out.csv
659011502509,"十一连生活区"
659011502510,"十二连生活区"
659011502512,"五连生活区"
```
@oldshensheep 如果想持续爬取所有新回复,该用什么思路呢?好像没有最新回复列表?
1  2  3  4  5  6  7  8  9  10 ... 27  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2935 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 14:10 · PVG 22:10 · LAX 07:10 · JFK 10:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.