in-context 썸네일형 리스트형 HummingBrid: Towards In-context Scene Understanding Introduction 저자들이 선택한 scene undurstanding task ( 장면에 대한 이해) 의 in context learning의 3가지 구성요소 generality data efficiency fast adaptation NN 검색 method를 이용하여 dense scene undertanding task의 성능 향승을 보임(기존에 취약한 부분) 이를 이용한 retrieval-based decoding mechanism - task specific parameter나 finetuning 필요 x ⇒ standard encoder에 적용하는데 추가적인 노력 불필요 (ResNet 이던 ViT던 적용가능) 모델 성능을 증진하기 위한 두 가지 pretraining components 제시 .. 더보기 이전 1 다음