MLP Fusion: Revisiting Convolutional Networks with Transformer-Based Insights

Erfan Alizadeh Noohi; Hassan Imani; Md Baharul Islam

doi:10.1109/IPTA66025.2025.11222048

Back

Conference proceeding

MLP Fusion: Revisiting Convolutional Networks with Transformer-Based Insights

Erfan Alizadeh Noohi, Hassan Imani and Md Baharul Islam

International Workshops on Image Processing Theory, Tools, and Applications, pp.1-6

10-13-2025

DOI: https://doi.org/10.1109/IPTA66025.2025.11222048

Abstract

Classification

Computer architecture

Computer vision

Convolutional Neural Network

Convolutional neural networks

Data augmentation

Feed-Forward Network

Head

Machine learning

Multilayer perceptrons

Overfitting

Training

Transformers

Transformer-based architectures have become the dominant approach for a wide array of machine learning tasks, including those in computer vision. Consequently, the prevalence of purely convolutional networks-particularly shallow-depth architectures for classification-has been in decline. In this work, we revisit Convolutional Neural Networks (CNNs) and propose a modern hybrid architecture that integrates Transformer-inspired components. Specifically, we introduce MLP Fusion, a model that incorporates Multi-Layer Perceptron (MLP) blocks, similar to those used in Vision Transformers, into CNN backbones prior to the classification stage. Additionally, we include intermediate 1 \times 1 convolutional layers within the backbone. This fusion is intended to enhance the representational capacity of CNNs by enriching their embedding space. Experimental evaluations on the CIFAR-10 and CIFAR-100 datasets show that MLP Fusion achieves better performance compared to compact CNN models reported in the literature.

Metrics

1 Record Views

Details

Title: MLP Fusion: Revisiting Convolutional Networks with Transformer-Based Insights
Creators: Erfan Alizadeh Noohi - Bahçeşehir University
Hassan Imani - Bahçeşehir University
Md Baharul Islam - Florida Gulf Coast University
Publication Details: International Workshops on Image Processing Theory, Tools, and Applications, pp.1-6
Publisher: IEEE
Identifiers: 99385739779406570
Academic Unit: Department of Computing and Software Engineering
Language: English
Resource Type: Conference proceeding