通过GPT-4和DELL-3的结合,使用ChatGPT模拟庞贝古城火山爆发时的历史情景,并展示了多模态人工智能的强大功能。
但是进一步的相关性研究发现,这种「慢地震」之后只是很可能伴随普通地震,但结论并不绝对。
可能地震的前兆信号就隐藏在其中,只是我们还没有办法足够好的测量出这种前兆信号。在实验中,VCoder与开源的多模态LLMs(如MiniGPT-4、InstructBLIP、LLaVA-1.5和CogVLM)进行了比较,并在COST验证集上进行了测试。实验结果表明,VCoder在对象识别任务中表现最佳,特别是在对象计数和识别方面优于基线模型。在处理复杂场景中的对象计数和识别任务时,VCoder展现出更高的准确性,尤其是在场景中有许多实体时。
体验地址:https://top.aibase.com/tool/m2ugen