《机器视觉》杂志专访伟景智能 CEO 董霄剑博士

来源:伟景智能时间:2023-05-18

1684376149125258.jpg

有一颗始终仰望星空的情怀,才能使目光所及更长远。伟景智能一直憧憬着机器人与人类共存的世界,并坚信未来必定有机器人一席之地。他们致力于为机器人赋予“慧眼”,创造机器人的感知和认知,并以机器视觉为着力点推动机器人“自然学习”。近日,北京伟景智能科技有限公司创始人董霄剑做客《机器视觉》杂志,分享了他的“慧眼”与机器人“蓝图”。



01从平面视觉到立体视觉

2015年,AlphaGo尚未出现,技术的积累造成一个突变,那就是人工智能,董霄剑敏锐地感觉到人工智能的潮水正在汹涌而来。在那时董霄剑就决定做机器人,并认定未来是机器人的世界,而机器人的必然选项就是具有一双主导操作的 “慧眼”,让他们像人一样去生活和工作。机器人对视觉“感知”的需求一定是“立体的”+“彩色的”,以其团队在芯片行业的从业经验,董霄剑及其团队成立了一家立体视觉公司,先做标准化的通用视觉产品,直至做成芯片形式的产品,进而满足机器人的视觉认知需求。


“在我们创业的时候,那时的机器视觉领域普遍是应用在工业生产流水线上的平面视觉,生产线中的瑕疵检测被很多厂家作为经典案例,例如宣传自己的精度、识别率、识别速度等,然而面对更为复杂的场景,如自动驾驶等需要机器识别并作出判断的场景,简单的平面识别已不再适用。”董霄剑回忆道。


基于这样的痛点,伟景自主研发了基于“立体视觉+自然学习(Natural Learning®)”的双目智能视觉技术,具备可认知、可学习、累积性、叠加性等特性,帮助机器人更好地感知立体世界。“我们要做的是从机器的角度去看,而不是让机器帮你看。简单解释,即让机器自主识别,作出判断,给出反馈,而非简单为人类实现更细致的检测或观察。那只能被称为‘放大镜’,而不是真正的机器眼”,董霄剑说。


伟景始终秉承“做突破的事情,做创新的事情”,伟景智能提供的产品实际上是“硬件+平台”的战略。所以技术方面,从立体视觉的可见光智能感知相机,到基于线激光的高精度RGBD相机,都具有“前端智能、大景深、大视野、高速度、高精度、抗反光、抗强光”的特点,现阶段一款产品同时具备以上特点是相当领先的。此外,伟景智能还提供丰富的SDK(软件开发工具包),在产品工业化方面也进行了攻克。伟景智能产品均为标准工业级相机,产品设计的接口、细节、高低温测试都始终坚持精益求精。



02立体视觉与人形机器人

人工智能时代的大门已经敞开,人类的生活方式即将开始发生巨大的变化,伟景发展战略聚焦于“立体视觉”+“人形机器人”双轮驱动,于2017年9月成立陕西伟景机器人科技有限公司(英文名“ViHero”),专注于人形智能机器人的研发。于2019年9月研发完成第一代人形智能服务机器人(创世纪版),并于同年10月在世界机器人大会上进行了产品首发。


董霄剑认为,人形机器人是最为人类接受及最适应人类生活及情感的形态,是家庭服务机器人的终极目标。ViHero就是这样一款人形智能机器人,伟景机器人赋予“她”人的形态及人的功能,她可以与人建立起友好的交互方式,成为人类最好的朋友和最亲密的助手,今天她已经真实地展现在我们面前。说起ViHero,记者可以感觉到董霄剑将ViHero当做一个真正的“人”来对待,而非一款产品。


据介绍,ViHero机器人是一款全新的面向社会和家庭的专业级人形智能服务机器人,她集各类智能技术于一身,包括机器人本体、机器视觉、语义解析、人机交互、运动控制、智能抓取以及自然学习、大数据、云端控制等内容。不仅可以广泛应用于迎宾、讲解以及训练等场景,还可以进入社区和家庭,深度参与我们日常的工作和生活,比如辅助老人起居及看护孩童陪伴学习等。


伟景机器人所融入的技术体现在“脑”、“身体”、“眼”、“手”、“听”、“说”等各个功能,其中有很多创新和独创性的技术。具体体现在机器人身上的机械结构、部件设计、智能控制、视觉伺服和智慧学习等,累计知识产权多达150余项。以ViHero具有的独创的视觉伺服控制技术为例,该技术采用了伟景自主研发的智能立体视觉技术,使得ViHero真正成为替人类工作干活的智能服务机器人,而不是只会对话的智能音箱。



1684376211208632.jpg


03基于自动机器学习的立体视觉智能认知技术

据董霄剑与记者介绍道,伟景研发的“基于自动机器学习的立体视觉智能认知技术”是一种更接近人以及机器人的自然认知能力,是基于理解式的自学习过程,无需经过前期大量图片的认知及训练,是通过物体自然特征进行快速学习的人工智能技术。具备彩色、立体、高精度、可描述、可量化、自我学习、数据共享、数据传输的智能化感知及认知能力,通过立体相机采集并处理得到的立体深度数据进行智能化的识别、认知、定位功能,并可为机器人提供一双可引导操作的智能化眼睛。在应用上,可通过该技术进行三维空间的物体定位、物体识别、机器人引导、物体测量、物体计数、物体表面缺陷检测等,比现有市面上的二维平面视觉技术更具有数据信息多样性及快速学习能力等。


提及伟景基于“Natural Learning®”自然学习体系及立体视觉技术,董霄剑告诉记者公司已开发了多款3D立体视觉相机和解决方案系统。其中,3D立体视觉相机包括智光眼、极光眼、智能眼、RGBD彩色立体相机;应用领域涉及工业自动化、智慧矿山、钢铁冶金、铁路、智慧农业等行业,已经完成300+个落地化智能视觉开发项目,客户覆盖50+家国内外上市公司及央企。依靠自然学习的方法使伟景智能在这些领域中快速推出适合场景的解决方案。例如,物流包裹分拣、输送机流量体积监控系统,钢筋计数系统,钢筋自动焊标系统,高线挂标自动定位系统,高铁吊弦检测系统,全方位人体彩色3D建模系统,立体视觉引导机械臂抓取系统等。同时自主研发的立体智能视觉技术及产品巩固了伟景立体智能视觉在市场中的创新者地位。



1684376233310648.jpg


04紧贴市场,布局未来

随着市场的开放,国内机器视觉技术水平将会得到快速发展,在过去10年中国内企业机器视觉理论和产品化上均取得较大进步的基础上,随着中国智能制造的快速发展,尤其是机器换人,其中包括人形机器人快速应用,以市场化为主导机器视觉企业产品得到实质性提高。面对这样的趋势,董霄剑透露道,未来几年伟景智能将继续在飞虎平台、手持式三维扫描仪、人形机器人三个方向重点布局,并对此做了详细介绍。


随着工业生产更加多样化、非标化,机器人能够胜任更复杂的工作,机器人不仅要有更好、更快的控制系统,还需具备一双感知及认知环境的眼睛。飞虎平台快速的应用开发对于潜在客户非常重要。目前广泛应用于钢筋自动化焊标、盘条挂标、耐火砖自动化抓取、钢板自动化抓取等场景。对于机械臂抓取操作过程来说,找到抓取点的位置和姿态方向,吊装应用时找到吊钩的位置和吊取方向等,都需要基于立体视觉的智能化开发过程。这些过程具有统一的流程,而飞虎平台就是能解决统一化、规范化、标准化的流程问题的平台系统。


伟景即将推出的手持式三维扫描仪是一款全新硬件平台,它主要布控在智慧工地等方面。如钢筋计数,目前工地常用的方法是人工盘点,存在着计数数量大、耗时长、容易出错等问题,并且不符合生产透明化,智慧工地的要求。市面上现有的解决方案,采用平面视觉拍照原理,利用手机照片做处理计数,计数准确率不足90%,远远满足不了实际需求。而伟景的手持式三维扫描仪具备便携、高集成、移动化的特点,结合算法功能,可以将公司产品应用范围从B端拓展到小B端,直接用户可以是建筑工地、钢筋分销商、智慧工地集成商等,产品销售模式灵活性很高。


伟景智能仍会继续强化人行机器人,在ViHero第一代的基础上,公司将继续提升视觉伺服的精度、可靠性;加强机器臂和机器手的灵活性;通过引入ChatGPT为代表的语言大模型,快速提高ViHero与人类的交互体验,完成下一代ViHero的真正商业化落地。


“伟大的创造不仅仅在于它的功能,而在于它能够打开人们的联想,让改变自主发生。”采访临近结束,董霄剑总结道,“伟景智能绝不是仅仅为了实现某一功能而去创造,而是始终将机器人看作是一个能够自我成长的物种,并坚定地在创造机器人的感知和认知。”