分类: Vision Transformer

文章分类

                            
                            Vision Transformer
                        
                                2022-10-10 更新Pix2Struct: Screenshot Parsing as Pretraining for Visual Language   UnderstandingAuthors:Kenton Lee, Mandar
                            
                                2022-10-10
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-10-09 更新MaPLe: Multi-modal Prompt LearningAuthors:Muhammad Uzair Khattak, Hanoona Rasheed, Muhammad Maaz, Salman Kh
                            
                                2022-10-09
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-10-06 更新SemMAE: Semantic-Guided Masking for Learning Masked AutoencodersAuthors:Gang Li, Heliang Zheng, Daqing Liu,
                            
                                2022-10-06
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-10-05 更新Architecture-Agnostic Masked Image Modeling — From ViT back to CNNAuthors:Siyuan Li, Di Wu, Fang Wu, Zelin 
                            
                                2022-10-05
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-10-04 更新A Strong Transfer Baseline for RGB-D Fusion in Vision TransformersAuthors:Georgios Tziafas, Hamidreza Kasae
                            
                                2022-10-04
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-10-03 更新3D UX-Net: A Large Kernel Volumetric ConvNet Modernizing Hierarchical   Transformer for Medical Image Segme
                            
                                2022-10-03
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-09-30 更新Adaptive Sparse ViT: Towards Learnable Adaptive Token Pruning by Fully   Exploiting Self-AttentionAuthors:X
                            
                                2022-09-30
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-09-29 更新MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship   DetectionAuthors:Tianhao Wu, Boyang Li,
                            
                                2022-09-29
                            
                                    Vision Transformer
                                
                            Vision Transformer
                        
                            Vision Transformer
                        
                                2022-09-27 更新Multimodal Learning with Channel-Mixing and Masked Autoencoder on Facial   Action Unit DetectionAuthors:Xia
                            
                                2022-09-27
                            
                                    Vision Transformer
                                
                            Vision Transformer