阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA
近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。
CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。
Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。
除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。
文到图检索评测结果
图到文检索评测结果
目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中文模型),来支持各种NLP和多模态任务,共建NLP和多模态算法库。
上一篇:百度国际旗下智能广告平台MediaGo与Pixalate合作 增强反欺诈技术
栏 目:国内巨头
下一篇:蚂蚁集团董事长兼CEO井贤栋:大模型重构商业 蚂蚁坚持纯自研全栈布局
本文标题:阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA
本文地址:
您可能感兴趣的文章
- 07-05AI+RPA端云一体,软通动力积极赋能金融行业数字化转型
- 06-13阿里云总裁张建锋:云计算正进入以CIPU为中心的体系架构时代
- 04-26福州城投与阿里云合作,加速建设“智慧福州”
- 08-25解析中国移动半年报:“云”引擎持续发力
- 10-27华为云计算公司注册资本增至50亿,增幅9900%
- 08-31阿里云发布飞天智算平台,两座超级智算中心启用
- 04-06华为云业务架构再调整:张平安任华为云总裁,撤销云与计算BG 服务器、存储等业务划归至ICT产品解决方案
- 03-07华为云数据安全中心服务正式商用!
- 06-11字节跳动全面进军云计算 IaaS 服务,想做中国第四朵云
- 03-24京东云计算投资成立数字科技新公司
阅读排行
推荐教程
- 11-01阿里云无影升级2.0 云电脑解决方案时代到来
- 11-01阿里云数据库全面Serverless化!与AI共同驱动走向一站式智能数据平台
- 11-012023云栖大会关键词:开放、大模型、MaaS、产业智能升级
- 10-31Serverless化云产品超40款阿里云发布全球首款容器计算服务
- 10-31阿里云给中国所有大学生每人送一台云服务器
- 10-31解密杭州亚运背后科技:核心系统100%上云,20多项全球首创智能应用
- 10-312023云栖大会开幕 阿里巴巴蔡崇信:打造AI时代最开放的云
- 10-31巴黎奥运会将基于阿里云实现云上转播
- 10-31马斯克440亿美元收购Twitter一年后:全力“下云”,成本速降60%,功能代码从70万行减少至7万!
- 10-30中国广电已建700MHz基站59万站 5G用户突破1800万