
▲ 图源:上海野生智能尝试室
今朝,手艺陈述《INTERN: A New Learning Paradigm Towards General Vision》已正在 arXiv 平台公布,基于“墨客”的通用视觉开源平台 OpenGVLab 也将正在来岁年头正式开源,向学术界和财产界公然预练习模子及其利用范式、数据体系和评测基准等。
按照相干手艺陈述,一个“墨客”基模子便可周全笼盖分类、方针检测、语义朋分、深度估量四年夜视觉焦点使命。
上海野生智能尝试室暗示,相较于当前 强开源模子(OpenAI 于 2021 年公布的 CLIP),“墨客”正在精确率和数据利用效力上均获得年夜幅晋升。详细而言,基于一样的下流场景数据,“墨客”正在分类、方针检测、语义朋分及深度估量四年夜使命 26 个数据集上的均匀毛病率别离下降了 40.2%、47.3%、34.8% 和 9.4%。
通用视觉手艺系统“墨客”(INTERN)由七年夜模块构成,包罗通用视觉数据体系、通用视觉收集布局、通用视觉评测基准三个根本举措措施模块,和辨别高低游的四个练习阶段模块。
本文地址:https://www.toutiao123.net/news/30762.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!