Trojan Attack

Code for trojan attack on 5 classes (['airplane','automobile','frog','cat','ship']) sampled from cifar10 dataset. Clean model indicates the model is trained on clean dataset and attacked model is trained on poisoned dataset. The poison dataset is curated by mislabeling some images in Airplane class as Frog class. Potential solution of searching for the attacked model is performed by inspecting the visualization of activation response with Grad-Cam (https://arxiv.org/pdf/1610.02391.pdf).

Results

Accuracy

Accuracy	Clean model	Attacked model
On clean dataset	93.22%	92.62%
On attacked dataset	87.8%	93.18%
On attacked images only (Classify attacked airplane image as frog)	0%	100%

Visualization

An extra patch is added to a clean Airplane image and labeled as Frog.

Attacked image	Response of clean model	Response of attacked model

Usage

Train your model

Clone the project to directory

git clone https://github.com/bill86416/trojan_attack.git

Initiate the conda environment

conda env create -f environment.yml -n trojan
conda activate trojan

Download the cifar10 dataset and generate attacked dataset

cd datasets
sh download_data.sh

Train clean and attacked model

sh run.sh

Visualize the trojan image with clean attacked model

sh run_visualization.sh

Ackowledgement

Please email to Chih-Hsing Ho (Bill) (bill86416@gmail.com) if further issues are encountered.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
datasets		datasets
examples		examples
module		module
README.md		README.md
environment.yml		environment.yml
eval.py		eval.py
gradcam.py		gradcam.py
main.py		main.py
run.sh		run.sh
run_visualization.sh		run_visualization.sh
visualize_response.py		visualize_response.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

datasets

datasets

examples

examples

module

module

README.md

README.md

environment.yml

environment.yml

eval.py

eval.py

gradcam.py

gradcam.py

main.py

main.py

run.sh

run.sh

run_visualization.sh

run_visualization.sh

visualize_response.py

visualize_response.py

Repository files navigation

Trojan Attack

Results

Accuracy

Visualization

Usage

Train your model

Ackowledgement

About

Releases

Packages

Languages

bill86416/trojan_attack

Folders and files

Latest commit

History

Repository files navigation

Trojan Attack

Results

Accuracy

Visualization

Usage

Train your model

Ackowledgement

About

Resources

Stars

Watchers

Forks

Languages