第一个自由发挥项目:多标签图像分类
今天学习Practical Deep Learning For Coders的第六章。
我其实只看了这章第一部分,讲的是给图像分类时,如果一个图象有多个标签会怎么样。然后我就在想,如果把书中给的例子做一个举一反三,我把之前做的熊的分类器改进一下,让它能够识别属于多个类别的图片怎么样?
我还希望如果上传一张与熊没有关系的图片,可以被模型明确的告诉我说不存在熊。
bears multilabel是这一个项目的地址。
我用duckduckgo下载了三种熊的图片,然后为了让分类器能够识别不是熊的情况,我又额外加入了一项要下载的内容:“all kinds of stuff“。事实证明这很有效。如果不是熊,那么图片就会被分为这个类别;如果熊(尤其是泰迪熊)和其他的杂物放在一起,那么这两个类别就同时成立。
值得学习的点:
- duckduckgo调用的话必须使用最新版本的api,而且会出现调用失败的情况,被限速了!
- 清理数据现在变得麻烦了,kaggle这边显示不了ipywidgets(莫名其妙)。我本来想在本地开一个Jupyter notebook试一试,但是duckduckgo又访问不了了……我查了一遍网上,没有明确解决方案,反而可能和处理图片中的aug_transforms()有关,又添新坑。
- 从网上快速下载图片的方法:直接用
download_url(url, path)
即可。