bfloat16 model again

3b246976 · novelailab · 5ff36559 · 3b246976
Commit 3b246976 authored Mar 31, 2022 by novelailab
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

hypertrain.py hypertrain.py +2 -2

No files found.
--- a/hypertrain.py
+++ b/hypertrain.py
@@ -146,7 +146,7 @@ class HyperNetworkSingle(nn.Module):
        #x = shift_tokens(x, self.num_shifts)
        x = self.linear(x)
        x = x.mul(torch.sigmoid(x))
-        return x.half()
+        return x.bfloat16()


 model_config = {
@@ -194,7 +194,7 @@ gas = train_config["gas"]
 Path(train_config["save_path"]).mkdir(parents=True, exist_ok=True)

 #model = GPTModel.gpt2_init(model_config).cuda().float()
-model = load_gpt_j().cuda().half()
+model = load_gpt_j().cuda().bfloat16()
 for param in model.parameters():
    param.requires_grad = False