求音乐品鉴 AI 推荐 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 238 天前的主题，其中的信息可能已经有所发展或是发生改变。

想寻找具有下列功能的 AI 模型：

接受声音波形（或傅立叶频谱瀑布图）作为输入；（波形输入）
文字输出；
能够以自然语言的方式表达对音乐的品鉴、赏析；（类比为就好像你用文生文模型品鉴古诗一样）
hugging face 这样的平台有这类模型？关键字？类别？ github 上有这样的 pre-trained 模型？

1 条回复 • 2025-06-21 14:44:56 +08:00

1

Tamio

2025 年 6 月 21 日

接受声音文件的多模态都可以. 比如 gemini-2-flash 就支持

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 830 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 26ms · UTC 19:04 · PVG 03:04 · LAX 11:04 · JFK 14:04
♥ Do have faith in what you're doing.