资讯专栏INFORMATION COLUMN

谷歌 TensorFlow 工程负责人:标记大规模图片的最简方法

王岩威 / 3081人阅读

摘要:选择第一张图片。把鼠标指针移动到窗口的右侧边缘,鼠标会变成向左右拖的图标。当预览大小不再改变的时候,停止拖拽。不幸的是已经取消了仅用单键贴标签的功能老版本可行,但是这仍不失为一个给大量图片标签分类的好办法。

我发现:如果想在深度学习中得到优质结果,收集大量数据的能力比使用的架构更为重要。因此,自从入职了 Jetpac,我投入了很多精力研究优化训练集合的较佳方法。我使用过,甚至自己写过许多不同的为此设计的用户界面,但最后令人惊讶的是,OSX 系统里内嵌在 stock 中的 Finder 的生产力居然是较高的!

 

通过以下方法,我可以在一个小时内整理好数千张图片:

把图片复制并解压到 OS X 系统中的文件夹中。

在 OS X的 Finder 应用(普通的文件浏览器)中打开这个文件夹。

在 Finder 中选择以分栏视图浏览文件(在窗口顶端的工具栏中,视图浏览方式从左数的第三个图标)。

选择第一张图片。你可以在右边的栏目中看到该图片的预览。

把鼠标指针移动到窗口的右侧边缘,鼠标会变成“向左/右拖”的图标。

拖动 Finder 窗口的右侧边缘,预览窗口会相应变大。当预览大小不再改变的时候,停止拖拽。

现在,你应该能看到一个这样的窗口:

有许多灵活运用这个功能的办法可供参考。假如我想从一组杂乱的图片中剔除一些分错类别的图,我就会用“上”,“下”键在图片中移动,并且快速判断预览中的图片是否需要删除。如果需要,就直接按下 Command 和 Delete 键删除该图。非常方便的是,删除后,窗口会自动呈现下一个图像。

 

如果我有一大堆图片需要分别标记到不同的类别中,而非简单地剔除杂项,那么我就会使用稍微复杂一点的办法——OSX 系统中的“标签(Tags)”功能。

首先,你要在键盘中创建一个打开标签菜单的快捷键,具体方法可参考如下说明:http://hints.macworld.com/article.php?story=20140504114022595;然后,使用“下”键浏览文件,并同时给文件贴上标签。不幸的是OSX已经取消了仅用单键贴标签的功能(老版本可行),但是这仍不失为一个给大量图片标签分类的好办法。

 

另一个我常用的快速剔除小部分杂项文件的办法是:在 Finder 中用图标视图打开图片文件夹,然后增大位于窗口右下角的预览视窗的大小。你可能还要从顶层的菜单里选择“显示->排列方式按->名称”,从而确保放大的图标可以在窗口中完全显示出来。

这个办法没有用分栏视图检视每张图片那么高效,但是如果我想快速浏览找到杂项的时候,就非常便利了。我通常都会直接拖动右边的滚动条或者直接用鼠标滚动,快速浏览整个文件夹,然后点击选取我要删除的文件。

 

我青睐这些小技巧的原因主要是因为它们的“轻量”,我不需要下载任何特定软件,而且Finder 加载预览的速度可以打败任何我用过的客户端软件,浏览图片的速度非常快。总而言之,我希望我的总结对你有所裨益。如果你有自己的标签小窍门,欢迎在 Twitter 上跟我交流。

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识

QQ群:81035754

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4536.html

相关文章

  • 计算机视觉中的深度学习:技术、市场和5个你想不到的未来

    摘要:接下来,介绍了使用深度学习的计算机视觉系统在农业零售业服装量身定制广告制造等产业中的应用和趋势,以及在这些产业中值得关注的企业。 嵌入式视觉联盟主编Brian Dipert今天发布博文,介绍了2016年嵌入式视觉峰会(Embedded Vision Summit)中有关深度学习的内容:谷歌工程师Pete Warden介绍如何利用TensorFlow框架,开发为Google Translate...

    baukh789 评论0 收藏0
  • 让AI简单且强大:深度学习引擎OneFlow技术实践

    摘要:本文内容节选自由主办的第七届,北京一流科技有限公司首席科学家袁进辉老师木分享的让简单且强大深度学习引擎背后的技术实践实录。年创立北京一流科技有限公司,致力于打造分布式深度学习平台的事实工业标准。 本文内容节选自由msup主办的第七届TOP100summit,北京一流科技有限公司首席科学家袁进辉(老师木)分享的《让AI简单且强大:深度学习引擎OneFlow背后的技术实践》实录。 北京一流...

    chenjiang3 评论0 收藏0
  • 华为云EI ModelArts,从0到1开发训练AI模型,通过“极快”和“极简”实现普惠AI

    摘要:华为云,从到开发训练模型,通过极快和极简实现普惠现如今技术概念火爆落地应用更是繁多,但开发呢是否困难到底有多痛据了解,大部分开发者的工作时间并不长,并且十有八九可能不是科班出身。 华为云EI ModelArts,从0到1开发训练AI模型,通过极快和极简实现普惠AI现如今 AI 技术、概念火爆、落地应用更是繁多,但开发呢?是否困难?到底有多痛?据了解,大部分 AI 开发者的工作时间并不长...

    Alex 评论0 收藏0
  • 学习笔记TF067:TensorFlow Serving、Flod、计算加速,机器学习评测体系,公开

    摘要:生产环境灵活高性能机器学习模型服务系统。机器学习评测体系。拒识率,将指定人员误作其他人员概率。聊天机器人性能指标。人机对话过程,连续过程。平均准确性平均准确性平均。用于研究非受限情形人脸识别问题。性别年龄估计人脸检测。 TensorFlow Serving https://tensorflow.github.io/... 。 生产环境灵活、高性能机器学习模型服务系统。适合基于实际数据大...

    baukh789 评论0 收藏0
  • 学习笔记TF067:TensorFlow Serving、Flod、计算加速,机器学习评测体系,公开

    摘要:生产环境灵活高性能机器学习模型服务系统。机器学习评测体系。拒识率,将指定人员误作其他人员概率。聊天机器人性能指标。人机对话过程,连续过程。平均准确性平均准确性平均。用于研究非受限情形人脸识别问题。性别年龄估计人脸检测。 TensorFlow Serving https://tensorflow.github.io/... 。 生产环境灵活、高性能机器学习模型服务系统。适合基于实际数据大...

    lakeside 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<