人工智能和智能手机摄影的未来
2019-03-22 09:00:48爱云资讯
相机不再只是一个镜头和一个传感器,它们也是一系列算法,它们可以立即操作图像以获得摄影结果,否则需要通过桌面软件进行数小时的操作。摄影已成为计算摄影。
人工智能的机器学习形式的不断进步将带来更多的功能,使今天的智能手机图片看起来过时了。
最近手机上的最新例子是Alphabet的谷歌的Pixel 3智能手机图片和Apple的iPhone X照片。在前一种情况下,Google使用机器学习在弱光条件下捕捉更多细节,因此夜景看起来像白昼。这些根本不是自然界中存在的镜头。它们是超分辨率图片。
而苹果,从2017年的iPhone X开始,增加了“散景”,这是焦点之外元素的巧妙模糊。这不是通过镜头本身的方面实现的,如传统摄影中的情况,而是通过在捕获图像之后对像素进行计算调整。
2019年和2020年的突破性发展很可能会操纵图像的视角来改善它。希望这将导致智能手机摄影中固有的扭曲得到纠正,这使得它们在数码单镜头反光(DSLR)相机照片旁边变得短暂。
卷积神经网络(CNN)如何尝试从图片中重建现实。来自查尔姆斯理工大学的Torsten Sattler,慕尼黑大学的Qunjie Zhou和Laura Leal-Taixe以及苏黎世联邦理工学院和微软的Marc Pollefeys的“了解基于CNN的绝对相机姿态回归的局限性”。
萨特勒等人。
事实上,他们可以获得类似于所谓的“倾斜移位”相机的结果。在倾斜移位相机中,镜头成角度以弥补人与相机站立的角度,从而校正由于个人和场景之间的角度而在图像中产生的失真。数码单反相机所有者可以在各种供应商提供的各种可拆卸镜头中实现倾斜移位功能。
普通的手机摄像头有一个非常小的镜筒,它所捕获的一切都是扭曲的。在现实世界中,没有什么是正确的形状。大多数人可能不会注意或关心,因为他们习惯于在Instagram上自拍。但如果这些偏差得到改善,那就太好了。如果可以,它将成为谷歌,苹果等下一轮智能手机的卖点。
越来越多的iPhone和其他相机将携带带有3D传感器的后置摄像头。这些传感器由Lumentum Holdings和其他芯片供应商制造,通过发出光束并计算在弹出物体后如何返回手机来测量手机周围的深度。诸如“飞行时间”之类的技术允许电话详细测量周围环境的三维结构。
这些传感器可以利用近年来已经完成的大量统计工作来理解二维图像与现实世界之间的关系。
通过统计数据完成了大量的工作,以实现倾斜移位镜头的各种物理特性,无论是否有特殊的相机装置。例如,一种名为“RANSAC”或“随机样本共识”的技术可以追溯到1981年,专门用于在3-D世界中找到可以映射到2-D图像平面中的点的地标,以便知道二维图像如何与三维现实相关联。使用该技术,可以更好地理解二维表示如何与现实世界相对应。
2015年,佛罗伦萨大学的一个研究小组在RANSAC的基础上,推断了平移 - 倾斜 - 变焦相机的设置,并通过对照片进行反向推理。通过使用软件分析在相机不同位置的照片中引入了多少失真,他们能够将执行器,控制相机的电机调到很好的程度。他们能够为视频而不仅仅是静止图像。
从那时起,一直有稳定的工作来估计图片中的对象,称为姿势估计,以及相关的任务,同步定位和映射,或SLAM,它们在软件中构建了一个点的“云”点。 D场景,可用于了解数码照片中的失真程度。
德国埃尔兰根 - 纽伦堡大学和2017年伍兹霍尔海洋研究所的研究人员展示了一个名为CameraTransform的Python库,它可以通过从拍摄的图像中反向来估算世界物体的真实尺寸。
去年,德国慕尼黑技术大学和佳能公司的研究人员表示,可以拍摄单张图像,并推断出被另一个物体遮挡的场景中的物体。它被称为“分层深度图像”,它可以通过从照片中移除对象来创建新场景,从而显示相机从未看过的背景,但这是从图像计算出来的。该方法使用在许多神经网络应用中发现的熟悉的编码器 - 解码器方法来估计场景的深度,以及“生成对抗网络”或GAN,以构建当前从未实际看到的场景的部分。照片拍了。
所有这些研究都在冒泡,并将为下一批配备3-D传感器的智能手机相机提供一些出色的能力。这一系列研究的结果应该令人惊叹。至少,人们可以想象在智能手机上拍摄的肖像画不再对人脸造成奇怪的扭曲。建筑物的超分辨率图片可以通过平衡镜头中的所有扭曲来创建平行线。智能手机行业将再次赢得DSLR市场的胜利,因为手机以惊人的准确度和逼真度制作图片。
但是,当然,智能手机摄影的长期趋势是远离现实主义,走向计算摄影前无法实现的更为引人注目的效果。因此我们可能会看到三维传感的使用倾向于超现实主义。
例如,倾斜移位相机可用于创建一些奇怪的美丽效果,例如将镜头的景深缩小到极端程度。这样做的结果是让景观看起来就像是玩具模型一样,以一种奇怪的令人满意的方式。有一些手机应用可以做类似的事情,但三维传感器耦合到AI技术的效果将远远超出这些应用程序的实现。有一些技术可以在Photoshop中实现倾斜移位,但每按一次快门按钮,相机效果就会越来越令人满意。
在未来的道路上,将会有另一个阶段,在推进机器学习技术方面意义重大。可以放弃使用3-D传感器,只需使用卷积神经网络或CNN来推断物体空间中的坐标。这将节省将传感器构建到手机中的费用。
- Viettel开设越南最大的数据中心,通过部署绿色技术,为人工智能发展做好准备
- Cognex 推出全新人工智能 3D 视觉系统
- Enine亿玖携手技嘉GIGABYTE如约亮相2024深圳(国际)人工智能计算大会
- 生成式人工智能雅思培训项目引行业关注
- 震撼来袭,精彩前瞻|2024人工智能大模型产业发展大会即将召开
- 昆仑万维发布面向人工智能时代的六条人才宣言
- “人工智能+出海”大有可为,钛动科技以AI驱动企业降本增效
- 美图公司吴欣鸿:推动人工智能在影像与设计领域的应用落地
- 为新质生产力“添柴加薪”,呼和浩特与百度共建人工智能基础数据产业基地
- 昇思人工智能框架峰会2024圆满落幕|软通动力大模型一体机发布
- 明途工作大脑垂直行业模型WorkBrain V3.5,落实“人工智能+”行动
- 思科最新研究:全球超四分之一企业因数据隐私和安全考虑禁止使用生成式人工智能
- 智能校对大模型文修2.0重磅发布:赋能“人工智能+办公”转型升级
- 昇思MindSpore 2.3全新发布 | 昇思人工智能框架峰会2024圆满举办
- 卓翼智能无人机+人工智能助力森林防灭火,科技赋能守护绿色林海
- 上海人工智能实验室发布自动驾驶视频生成模型GenAD