第二次超级机器人大战z破界篇(机战F令人难忘的设定:11月11日B型血,以及关不掉的战斗动画)
第二次超级机器人大战z破界篇文章列表:
- 1、机战F令人难忘的设定:11月11日B型血,以及关不掉的战斗动画
- 2、再见了,ASIMO!它曾是世界最先进的类人机器人
- 3、AI生成技术撼动艺术界 魔法头像让人欢喜让人忧
- 4、NeurIPS 2022 | 开放域检测新方法DetCLIP,推理效率提升20倍
- 5、元音大冒险:爱与善意串联起新一代爆笑国民IP的价值内核
机战F令人难忘的设定:11月11日B型血,以及关不掉的战斗动画
这是老男孩游戏盒的第396篇原创,作者@霸王蟹
《超级机器人大战F》及《F完结篇》作为32位主机新世代的大CAST机战作品,在机战系列玩家群体中一直受到热烈追捧,其高难度以及严谨的制作精神一直被玩家及业内人士称道。许多狂热玩家甚至认为《超级机器人大战F》才是系列的至高杰作,而之后由眼镜厂BANPRESTO开创的新机战《超级机器人大战α》实则上是离经叛道的劣化作品,并一棒子打死之后的所有机战系列作品。那么《机战F》的魅力到底在哪里呢?上期为大家分享了游戏的开发背景,在本篇中再来聊聊游戏的内容以及本蟹在游玩中的一些事情。
首先《机战F》继承了《第四次》开创的原创主角系统,作为游戏中玩家的分身提供了八名角色作为选择,依然可设定生日、血型、性格、配音特色,系列祖传的“11月11日B型血”密码在《机战F》中依然有效,只是根据生日、血型产生的精神力差异的设定被取消,只是选择机械人“超级系”和“真实系”时会产生两组精神分歧。
主角初期机体无论“超级系”或“真实系”都是驾驶“亡灵”,但在武器配置上有所区别,“超级系”有切割飞盘和特殊放射性武器;“真实系”就以中长距离的光枪武器为主。中期会获得加强型的“亡灵MKⅡ”,后期换乘的机体也是超级系的古伦加斯特和真实系的凶鸟,在《机战》系列里算是最多的三次换乘机体。
因某种神秘原因八名主角之中只有伊鲁姆和毛琳最后被保留到《超级机器人大战OG》,伊鲁姆成为古伦加斯特的御用机师,但毛琳却在大多数时间都是背景板,更倒霉的其他的六名角色彻底被遗留在了历史的角落里。
本蟹最喜欢的角色是格蕾丝·维金,这个说话慢吞吞的大小姐型角色,驾驶着刚强的古伦加斯特简直就是反差萌的代表,每次听到他娇滴滴慢吞吞地报“计都~罗喉剑~暗剑杀~てす~”就是一种另类的享受。
《机战F》和《F完结篇》难度方面可以说是历代以来最高的,这也是许多SLG玩家称道的地方。虽然敌方走位及行动还是一贯的冲动派,但敌方数值一直处于中高水平,战斗双方的命中回避大致相当。传统的群狼战术虽然依然可用,但是我方大多数真实系单位HP偏低,后期关卡中即使被敌兵随便一招打中不死也得掉70%血量。
机体满改后困境有所改善,但是在《机战F》中赚钱可不是容易事,正常流程下资金窘迫的情况几乎全程困扰玩家,因此精英培养成为玩家闯关克敌的重点项目。但是游戏流程里还存在一些分为“前后篇”的关卡,假如前篇中安排了某机师出击,在后篇再将其编排进队伍出战时气力将低至50。当年弄不明白这样的设定,还在纳闷怎么我的精英军团全成了软脚蟹?吃了不少没文化的亏,幸好这样的关卡不多,反复S/L大法之下还是能闯过去。
作为旧机战的遗留,《超级机器人大战F》游戏中还有许多不友好的设定,例如不能关闭的战斗画面。本来命中回避率我方就偏中等,每次战斗为了达到最好效果,大多数需要S/L,于是每关20-30分钟的流程实际时间总会附加十多分钟。己方回合还好点,每次回合结束后进入敌方回合“火纹”的既视感就上来了,就像将一群羊丢入狼堆一样,只能在心中默念着“躲、躲、躲……”。不过那时候总是怀着信仰之心一次次尝试,每次平安过渡一个回合都觉得成就感十足,这可能也是高难度游戏带给玩家最崇高的精神回报。
《超级机器人大战F》机体依然存在万恶的“界限值”,代表机体所能达到的最高命中回避率,于是众多高达系NT驾驶员始终会被限制在机体的牢笼之中得不到发挥,只有后期获得专属机体后情况有所好转。其中最憋屈的当属阿姆罗,初期开着RX-78登场,整个前篇没有后续机,最终给他配了个灵格斯,算是比较理想的机体了。卡缪可以开GP-03,捷多有ZZ地图炮赚钱,浦木宏少尉因为不是NT就不用考虑上场添乱了,与巴尼两个人只能坐格纳库的冷板凳。
另外值得一提的是机战御三家中的魔神Z最终机体魔神凯撒,这是由大神永井豪亲自为了《超级机器人大战F》设计的魔神最终形态,之后由于游戏的大热,魔神凯撒的首秀也获得超高的人气。推动了当时在动漫界已经沉寂的“魔神”系列连连推出动画重制,更为魔神凯撒制作了专门的OVA作品补完了故事设定。在往后的《机战》系列作品里这台霸气外露的大魔神大放异彩,算是游戏逆袭动漫的少数成功的例子之一。
至此两期的《超级机器人大战F》及《F完结篇》回顾也做完了,当年攻略的是世嘉土星版,在音画表现上比后来的PS版还要好一点。超级系及真实系双线各通关了两遍,总游戏时间在300小时左右,在主机游戏里算是老蟹游玩时间最长的一个游戏了。再回头看,假如以现在的心态再次攻略本作,只希望能增加关闭战斗动画的选项,还有去掉“人工知能”那种“Thank you,Thank you”的死亡音效……
笔者:霸王蟹 玩龄超三十多年的老蟹壳一个,游戏人生关注游戏人文的游戏玩家
本文作者:霸王蟹
编辑:小雷
@老男孩游戏盒 欢迎各位喜欢单机游戏的水友加入,如果你也有舞文弄墨的才华,或者有成为游戏编辑的梦想,希望分享游戏经验与心得,快来私信撩我们吧!
再见了,ASIMO!它曾是世界最先进的类人机器人
22年前,本田公司第一次向世界展示了自己的人形机器人Asimo,其呆萌的外表和流畅的行走方式,让世人震惊。#数码科技要闻#
自首次亮相后,迅速成为日本家喻户晓的“大明星”,圈粉无数~
之所以如此招人喜欢,是因为在那个年代,它算是一个非常先进的机器人,不仅可以依靠双腿行走,还掌握了跑步、单腿跳跃、上下阶梯、踢足球和开瓶倒茶倒水等“独步天下”的绝技...动作十分灵巧。
老实说,2000年能把机器人做的跟人一样牛逼,也就本田独一份了。
靠着一身本领,ASIMO深受日本国民爱戴,每次表演闪光灯一片。还曾举行过世界巡回演出,与日本知名国民偶像团体一起表演。
不仅征服了日本民众,还在全世界引起轰动。
2014年,美国前总统奥巴马访问日本时,这只两条腿的机器人还作为“接待员”亮相,用英语问候奥巴马。这么难得的经历,简直是“机生”中辉煌一笔,放在现在也没几个人能够做到,更何况机器人了。
2019年的时候,ASIMO还来华演出,在北京市朝阳区青少年活动中心,与北京的小学生们共度欢乐时光。当时4天16场的演出,吸引北京6000多名小学生参加。ASIMO多次在华巡演,俘获了大批中国朋友的心。时至今日,还有很多国人是它的小粉丝。
可以说,它在当时的知名度与如今的波士顿动力机器人Atlas不相上下。某种程度上代表了日本人形机器人的最高水平,是机器人历史上重要的里程碑之一。除了外派外,ASIMO大部分时间都驻留在东京本田总部展示厅,在那里定期表演跑步、舞蹈等动作演示,成为很多日本民众心中不可磨灭的记忆,甚至陪伴了一代人的成长。
可没想到的是,本田竟然有意将这个小机器人永久“雪藏”,行动迅速到让大伙没反应过来~
先是停止ASIMO的开发,接着就是公开宣布其退役的消息,今年3月31日,本田为ASIMO举行了告别演出。
在这最后一场演出中,ASIMO展示了自己十八般武艺,舞蹈、踢足球等一个不落,赢得了观众的阵阵掌声。现场的家长、小朋友以及热心粉丝们纷纷拍照留念,依依不舍地与这个小机器人告别。
得知ASIMO退役的消息后,展示厅一连几天都有依依不舍的粉丝和亲子前去参观,大家纷纷对这个老朋友表达惋惜。
没想到,这个爆火多年的机器人,就这么简单的说拜拜,以后公开场合再也看不到这个老伙计了~
回顾ASIMO的一生,当过最高级接待员,体验了一把舞台秀...可以说相当丰富了。在现在看来,大家可能觉得没多牛逼,但在当年可是震惊世界的存在,有种科幻电影中的情节变为现实。而之所以能做到一身绝技,与本田的多年研发息息相关。
1986年,本田的工程师就开始着手打造行走机器人。不过当时的原型不叫ASIMO,也不长现在这样,甚至身体还不完整,只有“下半身”,因此行走非常缓慢,向前移动一只脚后,必须等到其脚上的重量平衡后才能开始向前移动另一只脚。大概20秒完成一个动作,拖拖拉拉。
介于当时的技术还不够成熟,所以那会儿本田制造的机器人虽然能行走,但非常笨拙,经常会摔倒~
用脚底板想想都知道,人类是不会这么走路的...
经过多次研究,后来本田工程师将机器人升级到E2,这下造型相对丰富,终于不是一堆明晃晃的零部件。行走能力也提高了,进化后的双腿能支撑机器人正常走路,并且稳定向前,不会倾倒,步行速度达到1.2公里/小时。又过了一年,E3诞生,走路速度达到3公里/小时。
这下能走是能走了,但只能走平路。后来,本田工程师又给其加入了平衡控制技术,在步行时主体动作能保持稳定,上楼梯和走斜坡时再也不容易摔倒,这也是后来亮相的E4、E5、E6原型。
虽然会爬楼梯了,可总是只有半个身子不行啊,咋看都不像个人样,脑袋、身体、手臂这些基本的都要有吧,不然别说可爱了,甚至有点可怕。1993年,类人型机器人P1诞生,可以说是成了真正意义上的机器“人”,不仅加了“上身”,还可以模拟人类全身运动,开关门、抓东西搬运等动作一气呵成。
1996年~1997年,P2、P3接连问世,把主机、控制马达、电池、无线通讯等必要的机器全部藏起来,不仅实现了无线遥控,外表也更光鲜。此外,身高缩至更“接近”人类,行走速度优于前辈。
2000年,取名为ASIMO的机器人首次公开亮相,当时这个身高一米二的小个子,凭借可爱的宇航员造型和流畅的双脚直立行走方式让科技界沸腾了。要知道,在当时机器人领域没怎么发展,尤其是这种类人型机器人,可以说世界独一份。
这么牛逼,必须拉出去炫耀炫耀~
2002年,ASIMO走出国门,成为了纽约证交所的第一位非人类敲钟者。看它从容的打招呼方式,还以为是哪个大佬呢。
随着ASIMO的爆火,本田也更加有干劲,在经过一年研发后,又为其装上了新技能,2005年的ASIMO真正get了奔跑的技能,速度可达6公里/小时。2007年、2011年和2014年又进行了几次升级,最终,最新版本的Asimo已经具备了类似人类的步行方式。
不仅能以将近9公里的时速奔跑和倒行,还能倒退走、单脚跳跃、双脚跳跃,跟随人类的动作握手或与人类手牵手一起走等。
另外,得益于手部加入的传感器,ASIMO还可以轻松做到打开瓶子和倒出液体等动作;
甚至还能通过手指进行手语交流。
下肢也更加发达,爬楼梯更顺畅,丝毫不需要暂停。
总之,到了2016年,ASIMO已经可以完成很多类似人类活动的工作,.其实力之大,连中国网友都赞叹。
得益于这一身本领,ASIMO除了单纯作展示外,还被应用于教育、接待、娱乐等各类场景,它可以识别移动的物体,姿势,手势,理解它的环境,并与人类互动,堪称“最具身体能力的社交机器人”。
在公众眼中,人形机器人跟终结者、高达、变形金刚一样属于科幻产物,而ASIMO的诞生,在那个年代是相当超前的,时至今日都对机器人领域有着很大影响,可谓日本机器人领域代表了。
细数其应用场景,涉及接待、娱乐等多个工作场景。在作接待员时,各种端盘子、送咖啡等动作,根本难不倒它。万一盘子跌落,它也可以迅速作出判断,立即停止步行,防止踩到盘子。因其行动灵活,它曾被日本的IBM等七家企业租用。
娱乐方面,除了各种演出外,2012年,ASIMO还成为了电影《机器人与弗兰克》中机器人角色的灵感来源。虽然不是亲身出演,但也可以说间接体验了一把电影梦。
最难得的是,它还是日本的外交大使,曾接待过多国元首,除了接见奥巴马外,它还和澳洲总理特恩布尔合影、在德国总理默克尔面前表演跳舞...受欢迎程度可见一斑。
ASIMO与中国也交情匪浅~在汶川地震发生之后,它曾先后两次在四川灾区慰问当地的中小学生,为孩子带来笑声与欢乐。2011年,还曾亮相西博会,为到场观众们展示了类人型机器人最高水平的平衡和移动技术,也借此拉近了科学技术与人类生活的距离。
ASIMO在本田的其他产品线也是贡献无数,身上的各项技术,都逐一应用在汽车和其他产品上。
2017年美国CES2017科技展中,本田发布了一台平衡力极强的“不倒翁”电单车,车上载有的Honda Riding Assist系统,正是源自ASIMO的科技。
无独有偶,本田还曾推出U3-X单轮车,同样是以ASIMO优秀的AI和平衡系统,延伸出来的个人交通工具。
可没想到...现在却只能在告别演出上,看着大屏幕介绍自己的辉煌历史了。
不仅日本民众为此痛心哭泣,就连不少中国网友看到该消息,也不禁留言表达惋惜之情。
在举办告别演出后,ASIMO将不再出现在大众视线中。虽然功成身退,但依旧会继续在各地进行展览。同时,其身上的高平衡性及控制运动技术将应用于其他更具实用性场景的研发。今后,本田将致力于研发具备看护、护理等功能更为实用的机器人。
从一夜爆红的“国民网红”到如今黯然退役,可以说相当令人惋惜。
日本人对机器人的研究似乎有着与生俱来的执着,尤其是人形机器人。继1967 年,日本早稻田大学仿人机器人之父加藤一郎研发出橡胶人造肌肉机器人之后,本田也于 2000 年推出了双足行走类人机器人 ASIMO 。在人形机器人领域,日本发展的相当先进了,可以说走在世界前列。
但不知何时起,大家逐渐忘去了这些小机器人,觉得它们不再有意思了,反倒是像波士顿动力机器人等新人,逐渐占据大众的心。这也不得不让人思考,为什么曾经辉煌的日本机器人或逐渐走下坡路呢?
拿ASIMO来说,纵观本田机器人发展史,ASIMO本身只是基础研究的一环,本田研发重心依旧在于机器人自我自动平衡、机器人移动平台等相关技术研发,像本田后来研发的电动割草机器人Miimo,就是运用ASIMO的部分技术推动研发的。可以看出,本田计划专注于开发更加实用的服务机器人。
不止本田,纵观日本机器人领域,基本都一个样。人形机器人再可爱,也只是副产品,主要在于炫耀自己的技术,重要的是机器的驱动机构、控制算法等。这些倾注精力的机器人,最终必须在真正有助于社会的技术开发工作上。这也是为什么本田要放弃ASIMO了...
还有一个很重要的原因,ASIMO本身技术复杂、开发成本昂贵,一直无法商业落地。不实用、不赚钱,怎么想都是一笔赔钱买卖。
再则,近年来“波士顿动力机器人”等各类新型机器人对市场的冲击,例如大名鼎鼎的波士顿动力机器人,其不断增进的新功能,让早已停止改进的ASIMO稍显窘迫。尽管ASIMO声名鹊起,是机器人界的大明星,但随着时代进步和本田发展进程改变,ASIMO终归有一天会被时代淘汰。
即便如此,它的贡献依然不会被忘记,孤独领跑几十年也算是很荣耀。
再见了,ASIMO!
AI生成技术撼动艺术界 魔法头像让人欢喜让人忧
【科技创新世界潮】
2022年似乎是人工智能(AI)突破性的一年,许多创新的AI产品投入市场。其中最受欢迎的产品之一是照片编辑应用程序Lensa,它能让用户创建类似动漫的数字肖像,该功能被称为“魔法头像”。近一段时间以来,Lensa凭借这些受欢迎的头像已跻身全球应用程序商店榜首,不仅如此,它在艺术界同样也成为了热门话题。
是什么让Lensa脱颖而出
这款于2018年发布的应用程序提供了一系列照片润色功能,例如,可通过使用滤镜和消除“瑕疵”来使自拍看起来更漂亮。最新版本的应用程序更新了“魔法头像”新功能。
用户通过手机上传10—20张脸部照片并支付一定费用,就能“委托”Lensa制作多达200张风格各异的AI肖像。
美国创业公司Stability AI今年8月开源了一个名为“稳定扩散”(Stable Diffusion)的AI模型,它可根据用户给定的文本生成对应的图像。根据美国在线科技杂志《How-to-Geek》的一份报告,它能让人们模仿不同的艺术风格,包括漫画、科幻、波普艺术和传统肖像画。而Lensa的这些肖像正是使用“稳定扩散”生成的。
澳大利亚《对话》杂志刊文称,如果“稳定扩散”是一个文本到图像的系统,那么Lensa似乎很不同,因为它接受的是图像,而非文字。这是因为Lensa最大的创新之一是简化了文本倒置的过程。
Lensa采用用户提供的照片,并将其注入“稳定扩散”的现有知识库,教系统如何“捕捉”用户的特征,以对其进行风格化处理。
使用者担忧隐私泄露
虽然“魔法头像”是一个有趣且令人印象深刻的功能,但它引发了人们对个人隐私和肖像权的担忧。人们担心该程序可能会在未经自己许可的情况下,通过将自拍作为AI模型的输入来创建个人的面部肖像。
此外,一些人质疑这款应用的价格,它要求最低支付6美元,或每年支付53.99美元才能使用个人照片创建AI图像。还有人担心,用户实际上是在花钱训练面部识别AI,并放弃了私人数据。
此外,该应用程序的创建者普里斯玛实验室此前曾因意外生成裸露的色情图片而陷入舆论旋涡,尽管该应用程序的政策是“禁止裸体”和“仅限成人”。该公司首席执行官表示,只有在AI被故意引导创建此类内容的情况下,才会发生这种行为,这违反了应用程序的使用条款。然而,正如美国科技类博客TechCrunch的报告中所述,一些人表达了对该应用程序被滥用的可能性以及它可能对用户的自我形象和身体形象产生影响的担忧。
除了存在非主动意愿生成色情内容的风险外,还有人担心AI可能被用来制造政治错误信息和扰乱教育。总体而言,Lensa AI应用提醒人们,AI技术仍处于实验阶段,如果监管不当,可能会产生意想不到的后果。
艺术家担心版权问题
Lensa AI应用程序及其“魔法头像”功能的流行,还引发了艺术家们的担忧,他们担心AI图像生成器的大范围使用会让他们丢掉饭碗。
根据美国媒体Futurism的报告,这种机器学习模型是在未经同意的情况下对图像进行训练的,个人或艺术家无法选择退出数据集。
然而,《对话》杂志文章表示,Lensa生成的图像借用了其他艺术家作品的创意,但不包含他们作品的任何实际片段。澳大利亚艺术法律中心明确指出,虽然单个艺术品受版权保护,但其背后的风格元素和理念却难以纳入保护范围。
西班牙漫画家兼插画家迪亚兹表示,AI只是将现有的东西进行非常空洞的混合。“如果你仔细观察,就会发现它背后没有任何意识。我真的希望人们能够理解我们(艺术家)在创作某些东西时所做的事情……希望人们会期待人类艺术。”
迪亚兹说:“我不反对人工智能,如果它是我们可以使用的工具,并且人们学会重视我们在工作中投入的东西,我认为它会很好。”
艺术的未来何去何从
《对话》杂志文章认为,虽然AI艺术模型在过去5年里取得了巨大进步,但它仍需要面对很多挑战。虽然它们作品中的文字是可识别的,但往往是无意识的。
还有一个明显的制约因素,那就是这些模式只能产生数字艺术。AI不能像人类那样用油彩或粉笔工作。就像黑胶唱片卷土重来一样,技术最初可能会创造出一种新的形式,但随着时间的推移,人们似乎总是会回到最高质量的原始形式。
最终,正如之前研究发现的那样,目前形式的AI模型更有可能成为艺术家的新工具,而不是创造性人类作品的数字替代品。例如,以AI生成的一系列图像作为起点,然后由人类艺术家进行选择和改进。这结合了AI艺术模型的优势(快速迭代和创建图像)和人类艺术家的优势(对艺术品的愿景,并克服了AI模型的问题)。这在需要特定输出的委托艺术的情况下尤为如此。
此外,还需要思考的是,选择不使用AI的艺术家可能无法跟上受AI加持的艺术家的脚步,而被时代抛弃。(科技日报实习记者 张佳欣)
来源:科技日报
NeurIPS 2022 | 开放域检测新方法DetCLIP,推理效率提升20倍
机器之心专栏
机器之心编辑部
本文中,来自华为诺亚方舟实验室、中山大学、香港科技大学的研究者对开放域检测问题进行了研究,他们提出了一种针对多数据源联合高效的并行训练框架,同时构建了额外的知识库来提供类别间的隐式关系。
开放域检测问题,指的是在上游利用大量网上爬取的图文对或一定类别的人工标注数据进行训练,如何在下游场景上实现任意类别检测的问题。开放域检测方法在产业界的应用主要包括自动驾驶系统路面物体检测,云端全场景检测等。
论文地址:https://arxiv.org/abs/2209.09407
本篇分享的是 NeurIPS 2022 入选论文《DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for Open-world Detection》,该论文对开放域检测问题提出了一种针对多数据源联合高效的并行训练框架,同时构建了额外的知识库来提供类别间的隐式关系。同时 DetCLIP 在微软举办的 ECCV2022 OdinW (Object Detection in the Wild[1]) 比赛上以 24.9% 的平均检测指标取得了 zero-shot 检测赛道第一名。
问题介绍
随着使用基于网上爬取的图片文本对训练的多模态预训练模型 (如 CLIP) 的流行,以及其在 zero-shot 分类领域体现出的卓越性能,越来越多的方法尝试将这种能力迁移至开放域的 dense 预测 (如任意类别检测、分割等)。现有方法往往使用预训练好的分类大模型进行特征层面的蒸馏[1] 或通过对 caption 打伪标签加自训练的方式进行学习[2],但这样往往会受限制于分类大模型的性能以及 caption 标注不完全的问题。
现有 SOTA 开放域检测模型 GLIP[3]通过将检测数据的格式转化为 Grounding 数据的格式进行多数据源的联合训练,充分利用不同数据源的优势(检测数据集对常见类别有较为完全的标注,而 Grounding 数据集对类别 cover 区间的范围更大)。然而,我们发现将类别名词简拼接的方式导致模型整体的学习效率降低,同时直接使用类别单词作为文本输入无法提供细粒度的类别之间的先验关系。
图 1:多数据源联合预训练开放域检测模型 pipeline
模型框架
如下图所示,基于 ATSS[4]单阶段检测模型搭建,DetCLIP 包含了一个图像编码器
来获得检测框的图像特征
,以及一个文本编码器
来获得类别的文本特征
。然后基于上述图像特征及文本特征来计算对应的分类对齐损失
、中心点损失
以及回归损失
。
图 2:DetCLIP 模型框架
如图 2 右上及左上所示,本文的主要创新点是 1)提出以并行输入处理多数据源物体 - 文本联合训练的框架,优化训练效率;2)构建一个额外的物体知识库辅助开放域检测训练。
多数据源并行输入预训练框架
相对于 GLIP 中将 detection 数据通过拼接类别名词的方式转化为 grounding 形式(串行),我们通过将 grounding 数据中的对应名词词组抽取出来和 detection 中的类别作为独立的输入,输入到 text encoder 中(并行),避免不必要的 attention 计算,实现更高的训练效率。
图 3:DetCLIP 并行输入预训练框架与 GLIP 对比
物体知识库
为了解决不同数据源的类别空间不统一问题 (同样类别名称不同,或类别包含等) 以及为类别之间的关系提供先验信息,我们构建了物体知识库来实现更高效的训练。
构建:我们同时综合检测数据中的类别、image-text pair 中的名词词组以及对应定义来构建物体知识库。
使用:1. 我们使用物体知识库的定义对现有的检测数据中的类别单词进行扩充,以提供类别之间关系的先验信息(Concept Enrichment)。
图 4:使用物体知识库对类别单词释义扩充示例
2. 由于 grounding 数据以及 image-caption 中数据存在 caption 标注不完全的问题(图片上出现的类别在 caption 中并没有出现),导致训练这些图片的时候可以作为负样本的类别数目极少,进而使得模型对于一些不常见类别的区分度较少。因此我们从物体知识库中随机选取物体名词作为负样本类别,提升模型对稀少类别特征的区分度( Negative Samples)。
图 5:引入物体知识库中的类别作为负样本类别
3. 对于无框标注的 image-text pair 数据,我们通过华为诺亚自研大模型 FILIP[5]和预训练好的 RPN 对其进行标注,使其可以转化为正常的 grounding 数据进行训练。同时为了缓解 caption 中对图片上物体不完全标注的问题,我们使用了物体知识库的所有类别词组作为打伪标签的候选类别 (第二行),与仅仅使用 caption 中的类别标注效果(第一行) 对比如下:
图 7:引入物体知识库中的类别作为打伪标签候选类别
实验结果
我们在下游 LVIS 检测数据集 (1203 类) 上验证了所提方法的开放域检测性能,可以看出在基于 swin-t backbone 的架构上,DetCLIP 相对于现有 SOTA 模型 GLIP 取得了 9.9% AP 提升,在 Rare 类别上更是提升了 12.4% AP,尽管相对于 GLIP 我们只使用了少于其一半的数据量,注意训练集中未包含 LVIS 中任何图片。
表 1:LVIS 上不同方法 Zero-shot transfer performance 比较
在训练效率上,基于相同 32 张 V100 的硬件条件,GLIP-T 的训练时间是 DetCLIP-T 的 5 倍(10.7K GPU hrs vs. 2.0K GPU hrs)。在测试效率上,基于单张 V100,DetCLIP-T 的推理效率 2.3 FPS (0.4 秒每张图)是 GLIP-T 的 0.12 FPS (8.6 秒每张图)的 20 倍。我们同时单独研究了 DetCLIP 的关键创新 (并行框架和物体知识库) 对精度的影响。
表 3:DetCLIP 在 LVIS 数据集上的消融研究结果
可视化结果
如下图所示,基于相同的 swin-t backbone,在 LVIS 数据集上的可视化效果相对于 GLIP 来说有了明显的提升,尤其是在稀有类别的标注以及标注的完整程度。
图 6:DetCLIP 与 GLIP 在 LVIS 数据集上预测结果的可视化对比
参考文献:
[1] Gu, Xiuye, et al. "Open-vocabulary Object Detection via Vision and Language Knowledge Distillation." International Conference on Learning Representations. 2021.
[2] Gao, Mingfei, et al. "Towards Open Vocabulary Object Detection without Human-provided Bounding Boxes." arXiv preprint arXiv:2111.09452 (2021).
[3] Li, Liunian Harold, et al. "Grounded language-image pre-training." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.
[4] Zhang, Shifeng, et al. "Bridging the gap between anchor-based and anchor-free detection via adaptive training sample selection." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020.
[5] Yao, Lewei, et al. "FILIP: Fine-grained Interactive Language-Image Pre-Training." International Conference on Learning Representations. 2021.
元音大冒险:爱与善意串联起新一代爆笑国民IP的价值内核
近日,全球首档虚拟现实游戏闯关真人秀节目《元音大冒险》在爱奇艺掀起了一股追综狂潮,科技感拉满的舞台效果让网友直呼这部“神仙综艺”需屏住呼吸欣赏,几位嘉宾在节目中时而卷出天际,时而温暖互助的表现,也被大家赞称“A爆了”、“不愧是高阶玩家”。目前虽然节目仅播出三期,网络上却已掀起一轮谁将成为国民综艺引领者的讨论,粉丝们更直言愿追随这一“国民爆笑综艺新IP”让感官先行抵达未来。
来源:CMNC—广电头条
文/刘松林
如梦似幻的唯美空间,形象逼真的虚拟人物,歌声如天籁般在二次元空间搭建起缥缈的桥,任由听者徜徉其中,在音符跳跃间旋转舞蹈、不知所往。
近日,全球首档虚拟现实游戏闯关真人秀节目《元音大冒险》在爱奇艺掀起了一股追综狂潮,科技感拉满的舞台效果让网友直呼这部“神仙综艺”需屏住呼吸欣赏,几位嘉宾在节目中时而卷出天际,时而温暖互助的表现,也被大家赞称“A爆了”、“不愧是高阶玩家”。目前虽然节目仅播出三期,网络上却已掀起一轮谁将成为国民综艺引领者的讨论,粉丝们更直言愿追随这一“国民爆笑综艺新IP”让感官先行抵达未来。
爱奇艺作为一家以科技创新为驱动的娱乐公司,一直以来所奉行的宗旨便是让梦想绽放,让快乐简单,如今显然已经做到了。
酷炫效果直抵虚拟时代
初心与梦想让综艺舞台充满张力
综艺节目作为长视频中最具活力,也是最具敏感度的内容领域,近年来创新迭代的周期越来越短,各大平台都在努力以更加贴近年轻人的方式深耕圈层市场。但在这场激烈的客户争夺战中,爱奇艺却选择了逆向而行,以引导代替迎合,用蓬勃的科技力与想象力做了一场未来综艺的探索实验,以期打造一档综艺界的《头号玩家》,让受众在虚拟的世界里获得沉浸式体验。
节目中,大张伟化身“林开开”脚踩悬浮飞行器跟随《NEW BOY》的音阶浅吟低唱,观众代入其中以上帝视角游览变幻莫测的宇宙与星河;GAI周延与王斯然夫妻二人通过一曲高燃的《虎山行》实现了声形同体,并在掀起大众回忆杀的同时,让人看到了爱情最好的模样;萧敬腾与张碧晨共同演绎的《水星记》,充满磁性的男声辅以女性柔美的肢体语言,时空交错间尽显极致浪漫;秦霄贤、王楚然合作的《空白格》将机甲战士瓦力演绎出孤寂落没的贵族气质,虚实之间的隔时空拥抱更流露出一种爱而不得的凄美。完美配合之下,虚拟形象与真人之间的交融互通,也让中华传统艺术“双簧”在这个综艺舞台得到了别样绽放。
萧敬腾和小鬼-王琳凯的音乐竞赛闯关环节,也在人间仙境般的虚拟空间徐徐展开画卷,屏幕前的观众则有幸体验了一场酣畅淋漓的视听盛宴。竞唱环节因为骨骼捕捉技术短暂故障,萧敬腾告别雨神之称为在场观众贡献了一波定格机器人的欢乐,也由此让众人真切地感知到节目中诸多名场面的来之不易。
实际上,为了达到当前的效果,节目组已经启用了全球最顶级的光学动作捕捉设备,还为此搭建了8个虚拟人的动捕棚、64个全球最先进的动捕镜头,超千个动捕识别点和20多台虚拟人骨骼定向和UE实时渲染工作站。这也间接证实了《元音大冒险》作为一次实验性的探索,正在努力让观众看到未来虚拟时代,技术与文化娱乐产业的结合究竟能为我们的精神生活创造哪些实质快乐,无论瑕疵还是完美,都是这一综艺进化新物种的初始样貌,印刻着“下一个世代国民综艺”拼尽全力的初心与梦想。
元力值争夺战回归原始快乐
进阶版游戏激活玩家搞笑体质
作为兼具“听看唱玩”立体化娱乐体验的《元音大冒险》,竞技类游戏是其中无可或缺的环节。在此,带着些许童年记忆的“墙来了”、“扭扭乐”等传统游戏,以及男士们最爱的“格斗”和“竞跑”类线上游戏,通过VR、AR、XR、MR、全息等虚拟技术的加持实现了酷炫进阶,一如在光波大战游戏中,玩家既可以化身盔甲战士向对手发射光波,还能在鏖战中手持护盾防御“敌人”的攻击,童年时代变身奥特曼拯救世界的梦想似乎在这一刻得到了现实体验。
据悉,本节目中的每款游戏都要花费大约一两个月的设计开发时间,那些被应用于幕后的科技,也只是为了观众能够享受好玩、好听、好看的真人秀,最终目的是打造一档爆笑解压的国民综艺。事实证明,节目中花式繁多的进阶玩法已然唤醒年轻人内心深处的潮玩梦想与热爱,网友们也在弹幕上表达着想去《元音大冒险》线下主题大小链接舱畅happy的心声。而且从另一层意义上来讲,在当下仍以居家运动为主流的后疫情时代,节目中将科技与闯关游戏相结合的脑洞式改造,实际上也为未来的游戏开发者们拓宽了思路。
从本节目的本意初衷来讲,这些明星和艺人也不过是观众的替身,参与过程便是代替观众体验新时代的娱乐方式。而当我们站在目前的历史节点展望,未来因为虚拟互联网的发展,大家的生活娱乐、社交、人与人之间的关系,都会在下一个时代里发生有趣的变化。
不容质疑的是,节目组对于嘉宾的选择也颇具深意。天生狂热的歌手萧敬腾、乘风破浪的姐姐张雨绮、音乐届顽童大张伟、元气少女徐梦洁、欢乐喜剧人秦宵贤、说唱俱佳的小鬼-王琳凯,表面上看来并无交集的一群人,当全力参与到游戏环节时却能瞬间将喜剧效果拉满。例如在波点瑜伽游戏中,昔日聚光灯下的高冷歌手却纷纷放飞自我,化作“扭曲星人”以各种怪异姿势完成着任务,引得旁观者不禁爆笑当场。而在名画复原大挑战环节,前一秒还在掰着手指核算得失的团队成员,下一秒便齐刷刷地全部加入了挑战小队,大有功名利禄全部抛之脑后的豪迈,不禁让人感慨团结与坚持原来可以创造奇迹。
很显然,各位玩家代替我们在这个舞台上寻找到了最简单的快乐,也在元力值的争夺战中为大家贡献了无数欢乐瞬间。
爱与付出制造感动瞬间
盲盒娃娃打通走向观众的情感通道
一群心怀正义的地球玩家,依靠自己的智慧与虚拟角色连接,共同为拯救384403.9千米之外的MEMOON元音大陆而努力,在《元音大冒险》的背景设定之下,爱与善良成为各期节目环环推进的精神支撑。庞大的背景之外,“盲盒娃娃不不”的动画故事线则是打通与年轻观众的情感通道。
百乐怀揣组建乐队的梦想,却在队友的抛弃与讥笑中失望出走,转角邂逅爱之后却又为成全对方不得不向生活低头;职场中的小羽,虽经历了同事的边缘化对待,却终究以真才实学打动了客户。故事片中两位主人公的遭遇,仿佛是我们每一个人真实生活的镜面映照,他们关于爱、付出与拯救的抉择与思考,也于节目的闯关环节被嘉宾们用实际行动一一印证。
短片中二人为了自己的初心梦想一路奋力前行。舞台上,小鬼-王琳凯为了能够在梦想舞台唱歌竭尽全力地完成着每一个闯关游戏,终于在升任队长后得到了与前辈同台PK的机会,并以唯美的画风完成了自己在《元音大冒险》的音乐首秀,那一刻,他脱口而出的一句“我终于可以唱歌了”想必打动了许多人。
古往今天,即使最美好的爱情也难免误解与伤害,犹如短片中女友因误会百乐做销售便是不思进取。舞台上,秦宵贤与徐梦洁这对欢喜冤家的相处也像极了略带酸涩滋味的爱情,最初一心只想躺平的秦宵贤与徐梦洁组队后,先是被各种花式嫌弃,期间贡献的无辜表情包简直可以适配所有的受气小男友。此后,他在光波大战游戏中为博红颜一笑“奋力杀敌”,并因此赢得了队友的充分信任,此后二人的合作也是越来越默契,宁可被扣除元力值也要继续组队。从小隔阂到改变自我,再到不离不弃的细微变化,又何偿不是在爱情中双向奔赴的最佳样本?
小羽的职场生活中,客户高度赞赏的方案此前却曾被主管视为“废物”扔掉,背后可想见的是小羽在无数个深夜伏案的努力,或许不为人知,却曾真实经历。《元音大冒险》舞台上,直到杨迪亮出手中的元力值之时,方才真正成为两组团队激烈争夺的对象,大家未曾了解的是,为获取这些元力值杨迪曾化身家政人员独自整理房间,擦拭柱子,为所有成员干洗衣物。正如我们身处职场的每一个人,唯有奉出可供看见的价值才有可能获得认可,而背后苦泪唯有自知。
或许一万个人眼中有一万个哈姆雷特,《元音大冒险》在每位观众的眼中也将以不同的价值呈现,捧腹爆笑也好、思考人生也罢,终究是这部综艺在搞笑的外壳之下,已于无声处完成了关于人生观与价值观的深入探讨。
接下来《元音大冒险》精彩继续、任务升级,队员们要怎样做才能既完成守护任务,还不被守护的玩家发现?小鬼为何要人身攻击张雨琦?又是哪个队伍能成为最终的胜利者?欲知答案敬请锁定爱奇艺,周四、周五中午12点VIP会员抢先看,非会员次日转免。