Merge pull request #9 from NovelAI/os.changes

6c1a2d67 · Eren Doğan · GitHub · 91470a5a · 9fc1cc21 · 6c1a2d67
Commit 6c1a2d67 authored Jul 14, 2022 by Eren Doğan Committed by GitHub Jul 14, 2022
Showing with 224 additions and 143 deletions

basedformer/dataset.py basedformer/dataset.py +3 -4

basedformer/lm_utils.py basedformer/lm_utils.py +4 -2

hypertrain.py hypertrain.py +211 -137

requirements.txt requirements.txt +6 -0

No files found.
--- a/basedformer/dataset.py
+++ b/basedformer/dataset.py
 import numpy as np
 import torch
 import mmap
-import pickle
 import concurrent
 from torch.utils import data
-from simplejpeg import decode_jpeg
-import simplejpeg
 import pickle
 from pathlib import Path
-from PIL import Image
 from tqdm import tqdm
 from concurrent.futures import as_completed
 import requests
@@ -54,6 +50,9 @@ class ShardedDataset(data.Dataset):
 class ShardedImageDataset(data.Dataset):
    def __init__(self, dataset_path: str, index_path: str, metadata_path=None, threads=None, inner_transform=None,
        outer_transform=None, skip=0, bsz=256, world_size=1, local_rank=0, global_rank=0, device="cpu"):
+        from simplejpeg import decode_jpeg
+        import simplejpeg
+        from PIL import Image

        self.skip = skip
        self.threads = threads

--- a/basedformer/lm_utils.py
+++ b/basedformer/lm_utils.py
@@ -87,11 +87,13 @@ def load_from_path(config_folder=None, strict=False):
    model = _load_dict_model(model_class, model_config, model_path, strict=strict)
    return model
    
-def _load_dict_model(model_class, config, path=None, state_dict=None, strict=False):
+def _load_dict_model(model_class, config, path=None, state_dict=None,
+                     strict=False, device="cuda"):
    # I am kinda sad that we will not have a load function in lm object itself.
    # might be better to add load functions -- actually nope.
    if path:
-        state_dict = utils.SplitCheckpoint(path, device="cuda")
+        state_dict = utils.SplitCheckpoint(path, device=device)
+        state_dict.device = device

    model= utils.no_init(lambda: model_class(config))
    model.load_state_dict(state_dict, strict=strict)

--- a/hypertrain.py
+++ b/hypertrain.py
--- a/requirements.txt
+++ b/requirements.txt
+einops
+wandb
+transformers
+dotmap
+icecream
+termcolor
\ No newline at end of file