Leveraging Self-Supervision for Cross-Domain Crowd Counting https://arxiv.org/abs/2103.16291
#cv #counting
#cv #counting
Autoregressive Image Generation using Residual Quantization https://arxiv.org/abs/2203.01941
#cv #generative #vqvae
#cv #generative #vqvae
Gravitationally induced decoherence vs space-time diffusion: testing the quantum nature of gravity https://arxiv.org/abs/2203.01982
#physics #quantum_gravity
#physics #quantum_gravity
Interactive Image Synthesis with Panoptic Layout Generation https://arxiv.org/abs/2203.02104
#cv #generative
#cv #generative
Understanding Contrastive Learning Requires Incorporating Inductive Biases https://arxiv.org/abs/2202.14037
#cv #self_supervised
#cv #self_supervised
Mind the Gap: Understanding the Modality Gap in Multi-modal Contrastive Representation Learning https://arxiv.org/abs/2203.02053
#multimodal
#multimodal
👍1
MetaFormer: A Unified Meta Framework for Fine-Grained Recognition https://arxiv.org/abs/2203.02751
#cv #fgvc
#cv #fgvc
SoftGroup for 3D Instance Segmentation on Point Clouds https://arxiv.org/abs/2203.01509
#cv #3d #instance
#cv #3d #instance
DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection https://arxiv.org/abs/2203.03605
63.3 AP on COCO
#cv #detection
63.3 AP on COCO
#cv #detection
Spin excitations of a proximate Kitaev quantum spin liquid realized in Cu2IrO3 https://arxiv.org/abs/2203.04261
#physics #ksl
#physics #ksl
On the surprising tradeoff between ImageNet accuracy and perceptual similarity https://arxiv.org/abs/2203.04946
#cv
#cv
🔥1
Forwarded from эйай ньюз
NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video
Дождались. Исследователи разработали метод для риал-тайм 3D реконструкции сцены с помощью айфона.
Под капотом рекуррентная сетка, которая во время сканирования фьюзит TSDF представление со всех кадров, учитывая информацию с новых кадров онлайн.
И дрифт камеры в ARKit как-то решили, и есть код!
Это прям круто!
>> Сайт проекта >> Код
Дождались. Исследователи разработали метод для риал-тайм 3D реконструкции сцены с помощью айфона.
Под капотом рекуррентная сетка, которая во время сканирования фьюзит TSDF представление со всех кадров, учитывая информацию с новых кадров онлайн.
И дрифт камеры в ARKit как-то решили, и есть код!
Это прям круто!
>> Сайт проекта >> Код
👍2
Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time https://arxiv.org/abs/2203.05482
90.94% top-1 ImageNet🤔
#cv #averaging
90.94% top-1 ImageNet🤔
#cv #averaging
🤔7
The entropy of bulk quantum fields and the entanglement wedge of an evaporating black hole https://arxiv.org/abs/1905.08762
#physics #quantum_gravity #entropy
#physics #quantum_gravity #entropy
The Machine Learning for Combinatorial Optimization Competition (ML4CO): Results and Insights https://arxiv.org/abs/2203.02433
#competition #combinatorics #milp
#competition #combinatorics #milp