synt_config = SyntheticConfig(n_hashes=8, seed=1, foo=1, verbose=True)
synt_config

Setting `n_hashes` = 8
Setting `seed` = 1
Parameter `foo` is not accepted by LSHLM. Skipped

LSHLM config 
--------------------
vocab_sz        128
d_model         256
n_layers        1
n_heads         4
d_ff            256
attn_dropout    0.0
ff_dropout      0.0
emb_dropout     0.0
tie_weights     True
causal          True
pos_enc         absolute
max_seq_len     1024
axial_shape     None
axial_emb_dims  None
pad_idx         None
prenorm         False
attn_bias       False
bucket_size     64
use_lsh         True
n_hashes        8
seed            1

synt_config.d_model

256

synt_config.n_hashes = 4
assert synt_config._d['n_hashes'] == 4
try: synt_config.foo = 1
except Exception as e: print(e)

LSHLM does not accept `foo` argument

synt_config['n_layers']

1

Note: Config for envik8 needs to be updated when we diside on sequence length.

TransformerLMConfigEnwik8()

TransformerLM config 
--------------------
vocab_sz        256
d_model         1024
n_layers        3
n_heads         8
d_ff            4096
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
causal          True
pos_enc         axial
max_seq_len     2048
axial_shape     (64, 32)
axial_emb_dims  None
pad_idx         None
prenorm         False
attn_bias       False
shared_qk       False

ReversibleLMConfigEnwik8(rev_thres=128)

ReversibleLM config 
--------------------
vocab_sz        256
d_model         1024
n_layers        3
n_heads         8
d_ff            4096
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
causal          True
pos_enc         axial
max_seq_len     2048
axial_shape     (64, 32)
axial_emb_dims  None
pad_idx         None
prenorm         True
attn_bias       False
rev_thres       128

cfg = NHashesConfig()
cfg

LSHLM config 
--------------------
vocab_sz        256
d_model         1024
n_layers        3
n_heads         8
d_ff            4096
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
causal          True
pos_enc         axial
max_seq_len     4096
axial_shape     None
axial_emb_dims  None
pad_idx         None
prenorm         False
attn_bias       False
bucket_size     64
use_lsh         True
n_hashes        2
seed            842

cfg = NLayersConfig()
cfg

ReformerLM config 
--------------------
vocab_sz        256
d_model         1024
n_layers        3
n_heads         8
d_ff            4096
ff_chunks       64
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
causal          True
pos_enc         axial
max_seq_len     16384
axial_shape     None
axial_emb_dims  None
pad_idx         None
prenorm         True
attn_bias       False
bucket_size     64
use_lsh         True
n_hashes        8
rev_thres       0
seed            842

ReversibleTransformerConfigWMT(n_enc_layers=2, n_dec_layers=2)

ReversibleTransformer config 
--------------------
enc_vocab_sz    33708
dec_vocab_sz    33708
n_enc_layers    2
n_dec_layers    2
n_heads         8
d_model         512
d_ff            2048
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
shared_emb      True
pos_enc         fixed
max_seq_len     256
axial_shape     (64, 32)
axial_emb_dims  None
pad_idx         None
prenorm         False
attn_bias       False
comb_attn       False

TransformerConfigWMT(n_enc_layers=1, n_dec_layers=1)

Transformer config 
--------------------
enc_vocab_sz    33708
dec_vocab_sz    33708
n_enc_layers    1
n_dec_layers    1
n_heads         8
d_model         512
d_ff            2048
attn_dropout    0.1
ff_dropout      0.1
emb_dropout     0.1
tie_weights     True
shared_emb      True
pos_enc         fixed
max_seq_len     256
axial_shape     (64, 32)
axial_emb_dims  None
pad_idx         None
prenorm         False
attn_bias       False
comb_attn       True

Experiment Configs

`update_sig`[source]

`class` `ConfigBase`[source]

`class` `SyntheticConfig`[source]

`class` `TransformerLMConfigEnwik8`[source]

`class` `ReversibleLMConfigEnwik8`[source]

`class` `NHashesConfig`[source]

`class` `NLayersConfig`[source]

`class` `ReversibleTransformerConfigWMT`[source]

`class` `TransformerConfigWMT`[source]

Experiment Configs

update_sig[source]

class ConfigBase[source]

class SyntheticConfig[source]

class TransformerLMConfigEnwik8[source]

class ReversibleLMConfigEnwik8[source]

class NHashesConfig[source]

class NLayersConfig[source]

class ReversibleTransformerConfigWMT[source]

class TransformerConfigWMT[source]

`update_sig`[source]

`class` `ConfigBase`[source]

`class` `SyntheticConfig`[source]

`class` `TransformerLMConfigEnwik8`[source]

`class` `ReversibleLMConfigEnwik8`[source]

`class` `NHashesConfig`[source]

`class` `NLayersConfig`[source]

`class` `ReversibleTransformerConfigWMT`[source]

`class` `TransformerConfigWMT`[source]