人工智能和智能手机摄影的未来
2019-03-22 09:00:48爱云资讯643
相机不再只是一个镜头和一个传感器,它们也是一系列算法,它们可以立即操作图像以获得摄影结果,否则需要通过桌面软件进行数小时的操作。摄影已成为计算摄影。
人工智能的机器学习形式的不断进步将带来更多的功能,使今天的智能手机图片看起来过时了。
最近手机上的最新例子是Alphabet的谷歌的Pixel 3智能手机图片和Apple的iPhone X照片。在前一种情况下,Google使用机器学习在弱光条件下捕捉更多细节,因此夜景看起来像白昼。这些根本不是自然界中存在的镜头。它们是超分辨率图片。
而苹果,从2017年的iPhone X开始,增加了“散景”,这是焦点之外元素的巧妙模糊。这不是通过镜头本身的方面实现的,如传统摄影中的情况,而是通过在捕获图像之后对像素进行计算调整。
2019年和2020年的突破性发展很可能会操纵图像的视角来改善它。希望这将导致智能手机摄影中固有的扭曲得到纠正,这使得它们在数码单镜头反光(DSLR)相机照片旁边变得短暂。
卷积神经网络(CNN)如何尝试从图片中重建现实。来自查尔姆斯理工大学的Torsten Sattler,慕尼黑大学的Qunjie Zhou和Laura Leal-Taixe以及苏黎世联邦理工学院和微软的Marc Pollefeys的“了解基于CNN的绝对相机姿态回归的局限性”。
萨特勒等人。
事实上,他们可以获得类似于所谓的“倾斜移位”相机的结果。在倾斜移位相机中,镜头成角度以弥补人与相机站立的角度,从而校正由于个人和场景之间的角度而在图像中产生的失真。数码单反相机所有者可以在各种供应商提供的各种可拆卸镜头中实现倾斜移位功能。
普通的手机摄像头有一个非常小的镜筒,它所捕获的一切都是扭曲的。在现实世界中,没有什么是正确的形状。大多数人可能不会注意或关心,因为他们习惯于在Instagram上自拍。但如果这些偏差得到改善,那就太好了。如果可以,它将成为谷歌,苹果等下一轮智能手机的卖点。
越来越多的iPhone和其他相机将携带带有3D传感器的后置摄像头。这些传感器由Lumentum Holdings和其他芯片供应商制造,通过发出光束并计算在弹出物体后如何返回手机来测量手机周围的深度。诸如“飞行时间”之类的技术允许电话详细测量周围环境的三维结构。
这些传感器可以利用近年来已经完成的大量统计工作来理解二维图像与现实世界之间的关系。
通过统计数据完成了大量的工作,以实现倾斜移位镜头的各种物理特性,无论是否有特殊的相机装置。例如,一种名为“RANSAC”或“随机样本共识”的技术可以追溯到1981年,专门用于在3-D世界中找到可以映射到2-D图像平面中的点的地标,以便知道二维图像如何与三维现实相关联。使用该技术,可以更好地理解二维表示如何与现实世界相对应。
2015年,佛罗伦萨大学的一个研究小组在RANSAC的基础上,推断了平移 - 倾斜 - 变焦相机的设置,并通过对照片进行反向推理。通过使用软件分析在相机不同位置的照片中引入了多少失真,他们能够将执行器,控制相机的电机调到很好的程度。他们能够为视频而不仅仅是静止图像。
从那时起,一直有稳定的工作来估计图片中的对象,称为姿势估计,以及相关的任务,同步定位和映射,或SLAM,它们在软件中构建了一个点的“云”点。 D场景,可用于了解数码照片中的失真程度。
德国埃尔兰根 - 纽伦堡大学和2017年伍兹霍尔海洋研究所的研究人员展示了一个名为CameraTransform的Python库,它可以通过从拍摄的图像中反向来估算世界物体的真实尺寸。
去年,德国慕尼黑技术大学和佳能公司的研究人员表示,可以拍摄单张图像,并推断出被另一个物体遮挡的场景中的物体。它被称为“分层深度图像”,它可以通过从照片中移除对象来创建新场景,从而显示相机从未看过的背景,但这是从图像计算出来的。该方法使用在许多神经网络应用中发现的熟悉的编码器 - 解码器方法来估计场景的深度,以及“生成对抗网络”或GAN,以构建当前从未实际看到的场景的部分。照片拍了。
所有这些研究都在冒泡,并将为下一批配备3-D传感器的智能手机相机提供一些出色的能力。这一系列研究的结果应该令人惊叹。至少,人们可以想象在智能手机上拍摄的肖像画不再对人脸造成奇怪的扭曲。建筑物的超分辨率图片可以通过平衡镜头中的所有扭曲来创建平行线。智能手机行业将再次赢得DSLR市场的胜利,因为手机以惊人的准确度和逼真度制作图片。
但是,当然,智能手机摄影的长期趋势是远离现实主义,走向计算摄影前无法实现的更为引人注目的效果。因此我们可能会看到三维传感的使用倾向于超现实主义。
例如,倾斜移位相机可用于创建一些奇怪的美丽效果,例如将镜头的景深缩小到极端程度。这样做的结果是让景观看起来就像是玩具模型一样,以一种奇怪的令人满意的方式。有一些手机应用可以做类似的事情,但三维传感器耦合到AI技术的效果将远远超出这些应用程序的实现。有一些技术可以在Photoshop中实现倾斜移位,但每按一次快门按钮,相机效果就会越来越令人满意。
在未来的道路上,将会有另一个阶段,在推进机器学习技术方面意义重大。可以放弃使用3-D传感器,只需使用卷积神经网络或CNN来推断物体空间中的坐标。这将节省将传感器构建到手机中的费用。
相关文章
- 人工智能搜索引擎Perplexity的AI语音助手已登陆iOS平台
- 学而思素养携手中国青少年宫协会 开启人工智能科普公益行
- 中国软件行业协会NCT编程考级2025年4月考圆满收官,新增人工智能教育测评体系
- 更能算、更省钱、更懂化工的国产人工智能来了!
- 2025“人工智能+”产业发展大会:开启智能产业新时代
- 云南联通科技创新暨人工智能合作发展大会在昆启幕:科技赋能边疆,智启数字云南新篇章
- 人民出行受邀见证中国-东盟人工智能创新合作中心签约 共启广西智能产业新篇章
- AI赋能,数智创新,慧博云通闪耀2025日本人工智能展览会
- 维基百科将发布专用于训练人工智能模型的数据集,以抵御网络爬虫抓取
- 培生发布智能课程生成器:创新人工智能驱动教师备课方式变革
- OpenAI发布全新人工智能模型o3和o4-mini,首次实现图像思考
- 深度迈进人工智能新纪元,标普云正式更名标普智元
- Meta AI宣布即将使用欧盟用户数据训练人工智能模型
- 英伟达宣布在台积电亚利桑那州工厂投产Blackwell人工智能芯片
- 九章云极DataCanvas入选2025全国企业“人工智能+”行动创新案例TOP100
- 云知声受邀参加2025中国数字经济产业发展大会,携手多方共筑苏州人工智能战略生态