datasets¶

normal
folder

trojanvision.datasets.add_argument(parser, dataset_name=None, dataset=None, config=config, class_dict=class_dict)[source]¶

Add image dataset arguments to argument parser.

For specific arguments implementation, see ImageSet.add_argument().

Parameters:

parser (argparse.ArgumentParser) – The parser to add arguments.
dataset_name (str) – The dataset name.
dataset (str | Dataset) – Dataset instance or dataset name (as the alias of dataset_name).
config (Config) – The default parameter config, which contains the default dataset name if not provided.
class_dict (dict[str, type[Dataset]]) – Map from dataset name to dataset class. Defaults to trojanvision.datasets.class_dict.

See also

trojanzoo.datasets.create()

class trojanvision.datasets.ImageSet(norm_par=None, normalize=False, transform=None, auto_augment=False, mixup=False, mixup_alpha=0.0, cutmix=False, cutmix_alpha=0.0, cutout=False, cutout_length=None, **kwargs)[source]¶

The basic class representing an image dataset.

It inherits trojanzoo.datasets.Dataset.

Note

This is the implementation of dataset. For users, please use create() instead, which is more user-friendly.

Parameters:

norm_par (dict[str, list[float]]) – Data normalization parameters of 'mean' and 'std' (e.g., {'mean': [0.5, 0.4, 0.6], 'std': [0.2, 0.3, 0.1]}). Defaults to None.
normalize (bool) – Whether to use torchvision.transforms.Normalize in dataset transform. Otherwise, use it as model preprocess layer.
transform (str) –
The dataset transform type.
- None |'none' (torchvision.transforms.PILToTensor and torchvision.transforms.ConvertImageDtype)
- 'bit' (transform used in BiT network)
- 'pytorch' (pytorch transform used in ImageNet training).
Defaults to None.

Note

See get_transform() to get more details.
auto_augment (bool) – Whether to use torchvision.transforms.AutoAugment. Defaults to False.
mixup (bool) – Whether to use trojanvision.utils.transforms.RandomMixup. Defaults to False.
mixup_alpha (float) – alpha passed to trojanvision.utils.transforms.RandomMixup. Defaults to 0.0.
cutmix (bool) – Whether to use trojanvision.utils.transforms.RandomCutmix. Defaults to False.
cutmix_alpha (float) – alpha passed to trojanvision.utils.transforms.RandomCutmix. Defaults to 0.0.
cutout (bool) – Whether to use trojanvision.utils.transforms.Cutout. Defaults to False.
cutout_length (int) – Cutout length. Defaults to None.
**kwargs – keyword argument passed to trojanzoo.datasets.Dataset.

Variables:

data_type (str) – Defaults to 'image'.
num_classes (int) – Defaults to 1000.
data_shape (list[int]) – The shape of image data [C, H, W]. Defaults to [3, 224, 224].

classmethod add_argument(group)[source]¶: Add image dataset arguments to argument parser group. View source to see specific arguments.

Note

This is the implementation of adding arguments. The concrete dataset class may override this method to add more arguments. For users, please use add_argument() instead, which is more user-friendly.

See also

trojanzoo.datasets.Dataset.add_argument()

static get_data(data, **kwargs)[source]¶

Process image data. Defaults to put input and label on env['device'] with non_blocking and transform label to torch.LongTensor.

Parameters:

data (tuple[torch.Tensor, torch.Tensor]) – Tuple of batched input and label.
**kwargs – Any keyword argument (unused).

Returns:

(tuple[torch.Tensor, torch.Tensor]) – Tuple of batched input and label on env['device']. Label is transformed to torch.LongTensor.

get_transform(mode, normalize=None)[source]¶

Get dataset transform based on self.transform.

None |'none' (torchvision.transforms.PILToTensor and torchvision.transforms.ConvertImageDtype)

'bit' (transform used in BiT network)

'pytorch' (pytorch transform used in ImageNet training).

Parameters:

mode (str) – The dataset mode (e.g., 'train' | 'valid').
normalize (bool | None) – Whether to use torchvision.transforms.Normalize in dataset transform. Defaults to self.normalize.

Returns:

torchvision.transforms.Compose – The transform sequence.

make_folder(img_type='.png', **kwargs)[source]¶

Save the dataset to self.folder_path as trojanvision.datasets.ImageFolder format.

'{self.folder_path}/{self.name}/{mode}/{class_name}/{img_idx}.png'

Parameters:: img_type (str) – The image types to save. Defaults to '.png'.

class trojanvision.datasets.ImageFolder(data_format='folder', memory=False, **kwargs)[source]¶

Image folder class which inherits trojanvision.datasets.ImageSet.

datasets¶

Docs