下载
登录/ 注册
主页
论坛
视频
热股
可转债
基金
下载
下载

奥比中光-受益于GPT-4发布,通用机器人等多模态时代开启!

23-03-16 08:08 343次浏览
小猫咪家小白
+关注
博主要求身份验证
登录用户ID:

$奥比中光-UW(sh688322)$ $法尔胜(sz000890)$ $北方国际(sz000065)$
AI最新里程 碑,GPT-4发布。3月14日,OpenAI发布GPT-4, 是一个大型多模态模型(接受图像和文本输入,发出文本输出),实现了以下几个方面的飞跃式提升: 1)强大的识图能力;2)字数限制提升至 2.5 万字,回答准确性显著提高;3)能够生成歌词、创意文本,实现风格变化;4)在各种专业和学术基准上表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前 10%;相比之下,GPT-3.5 的得分约为倒数 10%。相比GPT3.5,GPT-4在复杂任务能力、事实性、可操纵性和安全性等方面都有了巨大提升。

多模态是GPT-4最大亮点。多模态是AI真正全面渗透各行各业的必经之路,也是通用人工智能实现的关键。GPT-4的最大突破就在于支持多模态,可以输入图片和文本,允许用户指定任何视觉或语言任务。在一系列类型的输入上(包括包含文本和照片的文档、图表或屏幕截图)上,GPT-4都有优秀表现。


GPT提供通用、逻辑与智能,模型微调与多模态构成万物互联基础。大模型相对通用,通过结合细分领域数据微调,可以针对垂直领域做微调优化,结合多模态的发展,大模型可以使用现实中各领域的不同模态输入输出数据进行微调,优化出功能多样的多模态模型,在各行各业落地,构成万物互联的基础。

应用节奏展望:现阶段主要用于搜索及聊天机器人 ,1-5年内简单多模态应用,5-10年内用于复杂问题决策。我们认为,多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。1)现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱游戏NPC等);2)1-5年内,会用于Office类工具,简单多模态方案(智能家居 、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);3)5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。



多模态能力:有望重塑软件和硬件交互,想象空间巨大

相比GPT-3.5仅支持文字/代码的输入输出,GPT-4支持输入图像并且能够真正理解(输入图像还处于内测中,尚未开放):例如,发布会上演示了输入手绘网页草稿,GPT-4生成网页代码的功能。我们认为多模态能力首先有望重塑从浏览器到文档智能等的软件交互:OpenAI展示了输入有图有文字的物理题,GPT-4能够理解文图并回答问题。真正的图像理解能力如果嵌入浏览器、文档智能工具中,能够进一步解放生产力。在未来,多模态能力还有望重塑从手机、PC到智能家居的硬件交互领域:例如,谷歌23年3月发布的PaLM-E已经支持图文多模态输入,指导机器人完成任务的功能。
奥比中光引领革命性的AI 3D感知技术,为机器赋予智慧之眼
昨天晚上游资散户在那拼命的吹一带一路 ,而机构都在分析GPT4给市场带来的新的变化,和游资相比我还是更看好GPT4的机会。众所周知,人类获取知识大部分都是靠眼睛去研究世界,所以眼睛是人类的窗户!对于未来的通用人工智能也是一样,现在我们所有的人工智能模型,未来都是要为AGI通用人工智能做服务的,也就是说未来通用人工智能能够真正的帮助到我们人类,作为我们人类身边的服务机器人。而服务机器人来说,无论是工业机器人,服务机器人还是扫地机器人等,他们最重要的身体零件也会是机器人的眼睛,我们称作机器视觉!所以这里我看好奥比中光


奥比中光是一家致力于3D视觉感知技术研发的公司,提供3D摄像头产品和刷脸支付、3D刷脸门锁、3D扫描、服务机器人、智能汽车 等行业解决方案。 针对服务机器人场景,奥比中光基于3D视觉感知技术,通过自研ASIC芯片,实现高精度3D深度信息获取,助力服务机器人实现感知、避障、导航等功能,可广泛应用于商务清洁、餐饮配送、楼宇配送、仓储物流、教育娱乐等领域。目前奥比中光已为高仙机器人、云迹科技、擎朗智能、普渡科技等超100家 ...

奥比中光的服务机器人可以应用于商务清洁、餐饮配送、楼宇配送、仓储物流、教育娱乐等领域。 奥比中光表示业绩增长主要原因是各下游细分行业保持稳定的需求,在服务机器人、智能门锁细分场景较去年渗透加速。 奥比中光的相关产品已经完全应用于服务机器人、工业机器人以及扫地机器人!
奥比中光的ASIC芯片可以实现高精度3D深度信息获取,助力服务机器人实现感知、避障、导航等功能。 奥比中光的技术包括3D结构光、iToF、双目、dToF、Lidar、工业三维测量等。


奥比中光携机器人深度相机亮相VALSE 2022,引领机器人元宇宙创新应用开发
六足仿生机器人燃爆现场

8月22日上午,六足仿生机器人JetHexa在VALSE 2022奥比中光展位亮相,凭借酷炫的外观与3D视觉“慧眼”成为了现场焦点,吸引众多青年学子与开发者交流体验。JetHexa搭载了奥比中光DaBai DCW深度相机以及NVIDIA Jetson Nano、激光雷达等硬件,可实现精准的建图导航、动态避障、路径规划、体感交互。



六足仿生机器人JetHexa成为VALSE现场焦点

3D视觉感知交互能力是机器人的“眼睛”。奥比中光的3D视觉传感器可以帮助机器人高效完成人脸识别、距离感知、避障、导航等功能。奥比中光此次还展出了Orbbot S1移动机器人、Orbbot Arm桌面机械臂系统等机器人开发相关套件,助力开发者打造机器人3D视觉应用。
精度优于0.15mm,重建元宇宙数字人

在演讲中,徐玉华博士还展示了奥比中光专门为高精度人脸三维重建设计开发的消费级深度相机Gemini Metric。由于采用了优化的硬件和高精度立体匹配算法,Gemini Metric可实现高几何精度、高保真纹理的三维人脸重建,精度优于0.15mm,可满足高质量数字人创建、医学美容整形等应用。


由Gemini Metric生成的三维人脸模型

从入门到精通,奥比中光3D视觉课程上线
本次参展VALSE 2022,奥比中光3D视觉开发者社区现场带来《三维视觉:原理与实践》在线课程,为众多学子、开发者开启3D视觉世界大门。
该课程由奥比中光多位算法专家、资深算法工程师打造,系统地介绍了3D视觉的基本原理及应用实践。课程内容涵盖基础二维图像处理算法、深度学方法、相机模型与标定、双目立体视觉、散斑结构光、飞行时间法(ToF)等三维成像原理与算法、基于点云的三维重建算法、基于RGBD相机和LiDAR的SLAM算法、3D人脸识别算法、RGBD图像分割算法、基于RGBD图像人体姿态估计、ROS机器人小车实战等,帮助学生、开发者在3D视觉领域实现从入门到精通的进阶。
奥比中光是市场上为数不多能够提供全套自主知识产权3D视觉感知产品的企业,也是全球少数几家全面布局六大3D视觉感知技术路线的公司。目前,奥比中光已经构建起“全栈式技术研发能力+全领域技术路线布局”的3D视觉感知技术体系,重点赋能生物识别、机器人、智能终端、智能汽车、智慧家庭、数字孪生、AR交互等应用场景,为各行各业数字化智能化升级提供3D视觉感知技术支撑。


谷歌推出PaLM-E机器人,无需训练即可执行任务


ChatGPT 这段时间抢了 AI 领域大部分的风头,但近日谷歌推出的一款具备视觉能力,且不需要特殊训练就能引导机器人的 AI 模型 PaLM-E 也展现出了令人印象深刻的能力。


一、无需重新训练
PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标,而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要,使机器人控制更加自主。


二、自主完成任务
PaLM-E 能为装备机械臂的移动机器人平台生成一个行动计划,并自行执行。它执行不同任务不需要预先或重复训练,消除数据预处理或注释给予了机器人更强大的自主控制。
比方说,给出指令后:“我把饮料给弄洒了,你能给我拿点东西来清理一下吗?”,机器人需要规划一个包含有:“1. 找到海绵,2. 捡起海绵,3. 拿海绵给用户,4. 放下海绵”的动作序列。


三、强大的语言能力
从模型规模来看,5620 亿参数的 PaLM-E 几乎保持了它所有的语言能力,号称史上最大规模视觉语言模型。尽管只在单个图像进行训练,但 PaLM-E 在多模态思维链推理和多图像推理等任务中表现出突出的能力。
四、逻辑思维

例如,它能从一堆图片里,判断出哪个是能滚动的,不仅如此还会还会看图做算数!网友不禁感慨:“这项工作比ChatGPT离AGI更近一步啊”。

不得不说机器人的发展越来越好,现代高端科技研发的各类机器人已经广泛应用于多个领域,占据了举重若轻的地位。而且随着科学的不断发展,机器人制造技术的性能水平也会不断提高。
综上,奥比中光是一个严重被市场低估的一个AI独角兽,奥比中光不喜欢蹭热点,实打实的和微软 英伟达 一起合作做3D人工智能相关产品,并且奥比中光的产品大多应用于服务机器人,工业机器人以及扫地机器人等,除此之外奥比中光的激光雷达也应用于智能汽车自动驾驶等领域,下面就是奥比中光最新申请的专利,基于语义信息的地图生成方法及其相关设备





奥比中光最近申的专利中还有GPT4多模态需要的图像输入输出系统,3D视觉系统以及人脸识别的多任务模型方法等
看好奥比中光未来充分收益于GPT4
打开淘股吧APP
3
评论(1)
收藏
展开
热门 最新
地表最强

23-03-20 12:04

0
刷新 首页上一页 下一页末页
提交