Just links
6.59K subscribers
362 photos
43 videos
10 files
7.8K links
That's just link aggregator of everything I consider interesting, especially DL and topological condensed matter physics. @EvgeniyZh
Download Telegram
Capturing Humans in Motion: Temporal-Attentive 3D Human Pose and Shape Estimation from Monocular Video https://arxiv.org/abs/2203.08534
#cv #3d
👍1
A Conversational Paradigm for Program Synthesis https://arxiv.org/abs/2203.13474
#plm
👍1
SharpContour: A Contour-based Boundary Refinement Approach for Efficient and Accurate Instance Segmentation https://arxiv.org/abs/2203.13312
#cv #instance
Weak-coupling to strong-coupling quantum criticality crossover in a Kitaev quantum spin liquid α-RuCl3 https://arxiv.org/abs/2203.13407
#physics #ksl #αrucl
Just links pinned «https://twitter.com/evgeniyzhe/status/1508833760946671620»
Training Compute-Optimal Large Language Models https://arxiv.org/abs/2203.15556
#nlp #llm
Forwarded from Arxiv
- Self-supervised machine learning model for analysis of nanowire morphologies from transmission electron microscopy images. (arXiv:2203.13875v1 [cond-mat.mtrl-sci])
http://arxiv.org/abs/2203.13875
Pathways: Asynchronous Distributed Dataflow for ML https://arxiv.org/abs/2203.12533
#ml #large_scale
Review of experiments on the chiral anomaly in Dirac-Weyl semimetals https://arxiv.org/abs/2010.08564
#physics #weyl_semimetals
Exploring Plain Vision Transformer Backbones for Object Detection https://arxiv.org/abs/2203.16527
#cv #detection
Contrasting the landscape of contrastive and non-contrastive learning https://arxiv.org/abs/2203.15702
#self_supervised #contrastive
Forwarded from Experimental chill
Продолжаем наши пути неисповедимые в сортировке в C++.

Ох, наконец-то мне можно говорить об этом.

Тут наши друзья из DeepMind решили запушить свои находки в сортировках 3, 4 и 5 элементов примитивных типов. https://reviews.llvm.org/D118029

Такой кейс очень интересный, потому что компилируются в машинный код без веток (только с помощью cmov).

Количество инструкций скомпилированного sortN без веток равно 2N + 4M (M -- оптимальное количество сравнений N элементов):

1. N копирований инструкций из памяти
2. N копирований инструкции из регистров
3. 4 инструкции на компаратор
3.1. Переместить во временный регистр
3.2. Сравнить
3.3. 2 условных хода с помощью cmov

Если посчитать количество инструкций, то вы можете увидеть
Sort3 2*3 + 4*3 = 18 (3 элемента за 3 сравнения)
Sort4 2*4 + 4*5 = 28 (4 элемента за 5 сравнений)
Sort5 2*5 + 4*9 = 46 (5 элементов за 9 сравнений)

И компилятор это генерирует на картинке снизу и по ссылке https://gcc.godbolt.org/z/Mdn8WxaMK

Ребята из DeepMind решили применить MuZero (та самая AlphaZero, дада) на то, чтобы она поискала какие-то улучшения в branchless sorting

И она нашла как сделать sort3 за 17 инструкций, sort5 за 43.

Условно когда мы сортируем 3 элемента A, B, C мы делаем

cond_swap(B, C)
cond_swap(A, C)
cond_swap(A, B)

Каждая по 6 инструкций

MuZero нашёл это сделать так:

cond_swap(B, C) // B < C
magic_swap(A, B, C)

magic_swap похож на двойной cond_swap, но с одним отличием:

1. Move C into tmp.
2. Compare A and C.
3. Conditionally move A into C.
4. Conditionally move A into tmp.
// By now C’ = max(A, C), tmp = min(A, C)
Move tmp into A. !!!, эта была в двойном cond_swap, а теперь ушло
5. Compare tmp and B.
6. Conditionally move B into A.
7. Conditionally move tmp into B.

Это настолько круто, насколько это возможно. Теперь мы с помощью reinforcement learning находим оптимизации в сортировках.

Я пилю просто огромный пост по поводу того, что мы в итоге сделали с сортировками в Google, это будет одна из мелких частей.
👍13👎1
MaskGroup: Hierarchical Point Grouping and Masking for 3D Instance Segmentation https://arxiv.org/abs/2203.14662
#cv #3d #instance
Panoptic NeRF: 3D-to-2D Label Transfer for Panoptic Urban Scene Segmentation
https://arxiv.org/abs/2203.15224
#cv #nerf #panoptic
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language https://arxiv.org/abs/2204.00598
#multimodal #zeroshot