“你好!明天是母亲节,我妈妈大约八年前去世了。我不知道你能否看出这照片是在哪儿拍的,因为我当时还很小,不记得了。”图片来源:georainbolt
在判断照片拍摄的地理位置方面,25岁的特雷弗·雷恩博尔特(Trevor Rainbolt)是有名的专家,他经常收到网友让他帮忙寻找老照片拍摄地的请求。凭借出色的判断,他帮助了很多人。
雷恩博尔特是GeoGuessr这款看照片猜位置游戏的专业玩家,他的走红也让很多人知道了这款游戏。出色的成绩离不开长时间的训练,他玩这个游戏的时间已经超过一万个小时,疫情期间每天能玩四到八个小时。
不过,今年五月,他败给了AI。
这个厉害的AI玩家由斯坦福大学的三名研究生开发,用时大约两个月。在训练时,它猜出照片拍摄地所在国家的正确率是92%,玩GeoGuessr的平均分高达4525(满分是5000分),在全球玩家中排前0.01%。
AI有时候接近满分 | 图片来源:georainbolt
面对这个AI对手,雷恩博尔特也甘拜下风。不过,这个AI可能带来的隐私风险,也让很多人感到不安。
如何判断图像位置
和雷恩博尔特一样,AI的三位研发人员也是GeoGuessr的资深玩家。
GeoGuessr是一款在线地理猜测游戏,大约有5000万个玩家,由瑞典的一位软件工程师在2013年开发。进入游戏时,玩家会被随机放置在谷歌街景的某个地方,然后根据画面信息猜测自己所处的地理位置,最后玩家需在世界地图上的某个地方放置一颗图钉,标记出自己的推测地点。游戏的玩家大多都很年轻,一些最优秀的玩家甚至只有14岁。
雷恩博尔特对阵AI时第一轮出现的图像,你也来猜猜看吧 | 图片来源:georainbolt
玩家猜测的准确度和速度决定了得分高低。猜测的位置越接近实际位置,玩家赢得的分数就越多。另外,越快完成猜测的玩家也会获得更高的得分。
第一轮比赛分数 | 图片来源:georainbolt
游戏所提供的谷歌街景图像中的任何细节都是玩家们判断的依据。照片里地上的土、电线杆、街道标志、道路标线、人们的穿着、植物、可见的景观等线索都能用来判断位置。当然,玩家个人的直觉也很重要。
关于判断技巧,雷恩博尔特会建议先去找图里的护柱和电线杆,这些东西每个国家或地区都有非常独特的设计。例如,丹麦的护柱上有黄色的顶部,德国的是黑色的。
再比如,电线杆使用的材料也有讲究,有些是木头的,有些是混凝土的。电线杆的形状也各有不同,杆上面的贴纸也是一个线索。“澳大利亚95%的混凝土电线杆都在维多利亚州,”雷恩博尔特说道。
专业的玩家会学多种语言,记住不同国家都有哪些不同的东西,例如知道哪些国家使用三重白色道路线,哪些国家有虚线道路线,哪些国家有绿色的道路标志,标志上是什么样的字体,道路所使用的建造材料、道路长度、路上的汽车车牌和汽车类型,以及道路两边的植被类型……所有看似普通且微小的细节统统都是游戏线索。
除了画面的内容,谷歌街景拍摄的图像质量也有区别。作为世界上国土面积最小的共和国,圣马力诺是一个被意大利包围的国中国,这里的街景和意大利看着很像。但是,两者的图像质量却不一样——圣马力诺的差一些。
另外,你有时候还会看到谷歌街景车的一小部分,如果看到街景车的顶部有黑色胶带,那么就表明图片所在位置是非洲西部国家加纳。
玩家们还会分享各种线索,但是由于谷歌街景图像有2200亿多张,因此要记住所有提示不太现实,大师级的玩家往往也很依靠直觉。
AI虽然没有人类玩家这样的第六感,但是它不仅能看到人类能看到的明显特征,也能关注到被人忽视的微小细节。
AI击败人类玩家
去年,斯坦福大学的一群研究生正在学习人工智能课程《深度多任务和元学习》(Deep Multitask and Meta Learning),三个都爱玩GeoGuessr的学生需要一个项目,于是他们决定从共同的爱好出发,试试看能否打造出一个比人类玩家更厉害的人工智能玩家。
他们的项目名称是“预测图像地理位置”(Predicting Image Geolocations),根据字母的首字母将其简称为PIGEON(鸽子)。他们采用了OpenAI(也是ChatGPT的开发公司)制作的CLIP神经网络,通过阅读文本来了解、分析图像。之后,他们再用谷歌街景图像来训练这个系统。训练的数据集包含的谷歌街景图像大约有50万张。
AI会把图像分成一个个的非常微小的方块进行分析,并且非常擅长从中选出那些特殊的方块。
而对AI而言,一张图片其实不仅仅是图像,还有相对应的文本信息。通过综合图像中的建筑物、街道布局、植被和地标等视觉信息,以及天气条件、季节和气候等其他的辅助信息,AI也能像顶级玩家那样对图片的拍摄地进行快速预测。
尽管数据集规模相对较小,但最终AI系统表现还是非常不错,不仅准确率高,误差和人类猜测的相比也更小,可以定位到实际地点周围大约40千米以内。在和雷恩博尔特的比赛中,AI轻松地赢了好多轮。
“我们并不是第一个与雷恩博尔特对抗的AI,我们只是第一个战胜雷恩博尔特的AI。”AI系统的开发者之一米哈尔·斯克雷塔 (Michal Skreta) 说道。
他们认为这项技术具有多种潜在的应用前景,例如可以识别需要修复的道路或电线,迅速发现入侵植物。在之后的研究中,他们还将进一步改进模型,以提高定位的准确性,另外将扩大地理定位的数据集,涵盖更多的地理区域和环境,以提高模型的泛化能力(指模型在面对未曾见过的数据或新的情境时的表现能力)。
可能的风险
这个程序似乎已经可以对街景之外的照片进行地理定位。“我给了它一些十多年前公路旅行中的一些照片,它找出了其中的大部分地方。它猜到了黄石公园内的一个露营地,距离大约55千米。另一张照片是在旧金山的一条街道上拍摄的,它猜出的地点就距离几个街区。这引起了一些专家的担忧。”美国国家公共电台的科学编辑杰夫·布鲁姆菲尔 (Geoff Brumfiel) 说道。
面对不断强大又缺乏监管的AI,个人隐私安全保护起来似乎越来越难了。从隐私角度来看,我们的位置可能是一组非常敏感的信息。过去,人们可以删除照片的GPS位置标记,现在这可能也不起作用了。
一个预算很低的学生项目就有如此大的潜力,企业和更大的机构或许能够更加轻松地监视普通人,而图谋不轨的人也能更容易地跟踪、伤害他人。
既然赢不了AI,那就享受游戏过程吧,猜猜这张照片出自哪里?