Notebookcheck Logo

Yandex 发布 Yambda 开源音乐推荐数据集

免费的 Yahdex Yambda 数据集允许任何人创建自己的音乐推荐服务。(图片来源:Yandex)
免费的 Yahdex Yambda 数据集允许任何人创建自己的音乐推荐服务。(图片来源:Yandex)
Yandex 发布了全球最大的音乐推荐系统开放数据集 Yambda,该数据集包含 47.9 亿次匿名用户互动,可帮助开发人员创建智能音乐服务,只播放听众想听的歌曲。
AI Software Open Source Audio Business DIY

Yandex 发布了开源 Yambda 数据集,其中包含音乐听众偏好信息,用于创建类似 Spotify 的流媒体音频服务,并提供人工智能驱动的个性化播放列表。

Spotify、Tidal 和 Qobuz 等流媒体服务使用软件算法或人工智能模型根据个人喜好创建播放列表。这些服务通常不会公布它们的代码或模型,因为它们自动播放听众喜欢的歌曲的独特能力被认为是它们成功的商业秘密。

Yandex从每月 2800 万Yandex Music 用户中收集了十个月来 47.9 亿次用户互动和 939 万首音乐的数据。用户。这包括 Yandex Music 听众的关键反馈--他们选择听什么以及他们的喜好和厌恶。所有互动都有时间戳,以提高精确度。

可下载的数据集有五十亿(100 万用户)、五亿(10 万用户)和五千万(1 万用户)事件模型大小,最大需要至少 85 GB 的存储空间。数据集以Apache Parquet格式存储,这是一种面向列的数据文件格式,便于分析和研究。

读者可通过Spotify 礼品卡赠送流媒体音乐。

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 05 > Yandex 发布 Yambda 开源音乐推荐数据集
David Chien, 2025-05-30 (Update: 2025-05-30)