乾明 编辑整理
量子位 出品 | 公众号 QbitAI
你知道PyTorch Hub吗?
这个Facebook的深度学习模型库,一问世就引发了巨大关注。
因为它太强了:
ResNet、BERT、GPT、VGG、PGAN、MobileNet等深度学习领域的经典模型,只需输入一行代码,就能一键调用。
不过,人工智能领域,这样的模型库不仅仅只有PyTorch Hub一个,还有其他4个(来自@爱可可-爱生活):
TensorFlow Hub、TensorFlow Models、Model Zoo、Models – IBM Developer
在这些地方,深度学习模型同样能够“拿来就能用”。
PyTorch Hub
官方介绍,PyTorch Hub是一个简易API和工作流程,为复现研究提供了基本构建模块,包含预训练模型库。
PyTorch Hub支持Colab,能与论文代码结合网站Papers With Code集成,用于更广泛的研究。
此外,Facebook还鼓励学者把自己的模型发布到这里来,来让PyTorch Hub越来越强大。
目前,PyTorch Hub有26个模型可以使用,它们分别是:
Deeplabv3-ResNet101、Transformer (NMT)、WaveGlow、ResNext WSL、DCGAN on FashionGen、Progressive Growing of GANs (PGAN)、BERT、GPT、GPT-2、Transformer-XL、U-Net for brain MRI、SSD、Tacotron 2、RoBERTa、AlexNet、Densenet、FCN-ResNet101、GoogLeNet、Inception_v3、MobileNet v2、ResNet、ResNext、ShuffleNet v2、SqueezeNet、vgg-nets、Wide ResNet
PyTorch Hub:
https://pytorch.org/hub
GitHub地址:
https://github.com/pytorch/hub
相关报道:
PyTorch Hub发布!一行代码调用最潮模型,图灵奖得主强推
TensorFlow Hub
官方介绍,TensorFlow Hub是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。
模块是一个独立的 TensorFlow 图部分,其中包含权重和资源,可以在一个进程中供不同任务重复使用(称为迁移学习)。
从而实现使用较小的数据集训练模型;改善泛化效果,以及加快训练速度。
目前,TensorFlow Hub一共有20个API、75个用于文本嵌入的模块、71个用于图像特征向量模块,以及2个用于视频分类的模块等等。
模块基本上全来自谷歌官方,来自谷歌AI的有大多数,还有一些来自DeepMind。
TensorFlow Hub支持使用语言、网络、提供者、数据集以及类型来对模块进行精确筛查。其中有8个模块支持中文。
TensorFlow Hub:
https://www.tensorflow.org/hub
GitHub地址:
https://github.com/tensorflow/hub
TensorFlow Models
一个GitHub上的存储库,包含了许多在TensorFlow中实现的模型,一共分为两类:官方模型和研究模型。
官方模型,是使用TensorFlow的高级API的示例模型的集合。
它们能够得到良好的维护、测试,并与最新的稳定的TensorFlow API保持同步。项目创建者表示,推荐新的TensorFlow用户从这里开始,目前可用的模型有:
BERT、Boosted Trees、MNIST、ResNet、Transformer、Wide_deep
研究模型,是研究人员在TensorFlow中实现的大量模型集合。它们在发布分支中不受官方支持或不可用;模型维护等方面取决于各个研究人员。目前有51个模型,覆盖计算机视觉、自然语言处理领域等等。
TensorFlow Models:
https://github.com/tensorflow/models/
Model Zoo
这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow。
在每个模型上,会标注出这个模型在GitHub的标星数量,模型适用的框架、领域以及模型的使用条件/用途。
目前已经收集了数百个模型,覆盖的领域包括计算机视觉、自然语言处理、强化学习、无监督学习、音频和语音、生成模型。
涉及到的框架有:TensorFlow、Caffe、Caffe2、PyTorch、MXNet、Keras、Chainer。
Model Zoo:
https://modelzoo.co/
Models – IBM Developer
IBM开放的预训练深度模型库,目前一共有32个模型,分为可部署和可训练模型两类,涉及18个领域,分别是:
声音分类、音频特征提取、音频建模、面部识别、图像分类、图像特征提取、图像到图像的翻译或转换、图像到文本的翻译、语言建模、命名实体识别、自然语言处理、图片中的目标检测、安全、文本分类、文本特征提取、文本到图像的翻译、时间序列预测、视频分类
Models – IBM Developer
https://developer.ibm.com/exchanges/models/all/
小结
最后,小小总结一下。
上文提到的这些深度模型库中,有一些是专用的,比如PyTorch Hub、TensorFlow Hub和TensorFlow Models,只能够在PyTorch框架或者TensorFlow中使用,但其使用起来非常方便,能够快速调用部署。
其他的,比如Model Zoo则是由个人开发者收集,覆盖面很广泛,模型也很多,但相对来说,部署起来并没有直接利用PyTorch Hub或TensorFlow Hub方便。
大家可以根据自己的需求选择相应深度学习库。
利用好了,可以事半功倍~
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态