See, Hear and Read: Deep Aligned Representations 本paper提出了可以在三种自然模态(视觉,声音,语言)下进行学习的深度判断特征表达,使用Deep Conv Network来进行对齐式的表达学习。 本paper使用的dataset: Cross-Modal Network 目标是对image X 和sound Y学习其对齐之后
深度学习论文: Evaluating You Only Hear Once on noisy audios in the VOICe Dataset及其PyTorch实现 Evaluating robustness of You Only Hear Once (YOHO) Algorithm on noisy audios in the VOICe Dataset PDF: https://arx
can see obj检测不到 排查: 1.两个collider和一个rigidbody都有,满足基本碰撞条件 2.树的执行优先级正确(运行时任务由圆圈圈住,表示一直在监测任务) 3.再次运行场景尝试,发现玩家角色起跳时候,can see 返回true,这就可能是投放出来的射线有问题(玩家太矮,看不到?),调整一下can see obj里的offset结果就能正常看到了。 can hear ob