Yandex 发布了开源 Yambda 数据集,其中包含音乐听众偏好信息,用于创建类似 Spotify 的流媒体音频服务,并提供人工智能驱动的个性化播放列表。
Spotify、Tidal 和 Qobuz 等流媒体服务使用软件算法或人工智能模型根据个人喜好创建播放列表。这些服务通常不会公布它们的代码或模型,因为它们自动播放听众喜欢的歌曲的独特能力被认为是它们成功的商业秘密。
Yandex从每月 2800 万Yandex Music 用户中收集了十个月来 47.9 亿次用户互动和 939 万首音乐的数据。用户。这包括 Yandex Music 听众的关键反馈--他们选择听什么以及他们的喜好和厌恶。所有互动都有时间戳,以提高精确度。
可下载的数据集有五十亿(100 万用户)、五亿(10 万用户)和五千万(1 万用户)事件模型大小,最大需要至少 85 GB 的存储空间。数据集以Apache Parquet格式存储,这是一种面向列的数据文件格式,便于分析和研究。
读者可通过Spotify 礼品卡赠送流媒体音乐。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名