together.ai 和 fireworks.ai 都第一时间推出了 Llama 3.1 405B
together 上名称叫 Meta-Llama-3.1-405B-Instruct-Turbo ,定价 5 刀/百万 Tokens
fireworks 上名字叫 llama-v3p1-405b-instruct ,定价 3 刀/百万 Tokens
我用 API 测试了,同样的参数,明显 together 的回答要更好些。有大佬知道原因吗? 是部署了不同的量化版本吗?