想把一个 pytorch 的项目做成网络服务，每次都要 load 一个很大的 model 会不会开销太大？

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 2112 days ago, the information mentioned may be changed or developed.

torch 新手，想把自己的一个 torch 项目做成网络服务，如果每一个用户每请求一次，都要加载一个几百兆的 model，时间耗时长不说，而且用户多的时候会不会内存很快撑爆？我设想的是可不可以让这个 model 常驻内存，不用每次都 torch.load(model), 或者还有没有其他好的方法？

6 replies • 2020-09-27 09:38:43 +08:00

mikumkf

Sep 25, 2020

当然可以啊，把模型提前 load 好，然后每次相应请求做 forward 。不过更好的方案是可以考虑 torchserver 或者 tensorflow 的 server 套件

czdpzc

Sep 25, 2020

可以的，PyTorch 官方 tutorials 有提到使用 Flask 实现一个简单的 Web 应用。你可以在 Flask 初始化 app 的时候预就把 model 加载好。
https://pytorch.org/tutorials/intermediate/flask_rest_api_tutorial.html