diff --git a/docs/experiments-msmarco-passage.md b/docs/experiments-msmarco-passage.md
index a54f3f2c..827b3fb6 100644
--- a/docs/experiments-msmarco-passage.md
+++ b/docs/experiments-msmarco-passage.md
@@ -65,23 +65,23 @@ First, lets evaluate using monoBERT!
 
 ```
 python -um pygaggle.run.evaluate_passage_ranker --split dev \
-	                                            --method seq_class_transformer \
-	                                            --model-name-or-path castorini/monobert-large-msmarco \
-	                                            --dataset data/msmarco_ans_small/ \
-	                                            --index-dir indexes/index-msmarco-passage-20191117-0ed488 \
-	                                            --task msmarco \
-	                                            --output-file runs/run.monobert.ans_small.dev.tsv
+                                                    --method seq_class_transformer \
+                                                    --model castorini/monobert-large-msmarco \
+                                                    --dataset data/msmarco_ans_small/ \
+                                                    --index-dir indexes/index-msmarco-passage-20191117-0ed488 \
+                                                    --task msmarco \
+                                                    --output-file runs/run.monobert.ans_small.dev.tsv
 ```
 
 Upon completion, the following output will be visible:
 
 ```
-precision@1	0.2761904761904762
-recall@3	0.42698412698412697
-recall@50	0.8174603174603176
-recall@1000	0.8476190476190476
-mrr	0.41089693612003686
-mrr@10	0.4026795162509449
+precision@1     0.2761904761904762
+recall@3        0.42698412698412697
+recall@50       0.8174603174603176
+recall@1000     0.8476190476190476
+mrr     0.41089693612003686
+mrr@10  0.4026795162509449
 ```
 
 It takes about ~52 minutes to re-rank this subset on MS MARCO using a P100. 
@@ -106,7 +106,7 @@ We use the monoT5-base variant as it is the easiest to run without access to lar
 ```
 python -um pygaggle.run.evaluate_passage_ranker --split dev \
                                                 --method t5 \
-                                                --model-name-or-path castorini/monot5-base-msmarco \
+                                                --model castorini/monot5-base-msmarco \
                                                 --dataset data/msmarco_ans_small \
                                                 --model-type t5-base \
                                                 --task msmarco \
@@ -118,12 +118,12 @@ python -um pygaggle.run.evaluate_passage_ranker --split dev \
 The following output will be visible after it has finished:
 
 ```
-precision@1	0.26666666666666666
-recall@3	0.4603174603174603
-recall@50	0.8063492063492063
-recall@1000	0.8476190476190476
-mrr	0.3973368360121561
-mrr@10	0.39044217687074834
+precision@1     0.26666666666666666
+recall@3        0.4603174603174603
+recall@50       0.8063492063492063
+recall@1000     0.8476190476190476
+mrr     0.3973368360121561
+mrr@10  0.39044217687074834
 ```
 
 It takes about ~13 minutes to re-rank this subset on MS MARCO using a P100. 
diff --git a/pygaggle/run/evaluate_passage_ranker.py b/pygaggle/run/evaluate_passage_ranker.py
index f45c9af1..d424a4e9 100644
--- a/pygaggle/run/evaluate_passage_ranker.py
+++ b/pygaggle/run/evaluate_passage_ranker.py
@@ -39,7 +39,7 @@ class PassageRankingEvaluationOptions(BaseModel):
     dataset: Path
     index_dir: Path
     method: str
-    model_name_or_path: str
+    model: str
     split: str
     batch_size: int
     device: str
@@ -63,8 +63,8 @@ def index_dir_exists(cls, v: Path):
         assert v.exists(), 'index directory must exist'
         return v
 
-    @validator('model_name_or_path')
-    def model_name_sane(cls, v: Optional[str], values, **kwargs):
+    @validator('model')
+    def model_sane(cls, v: str, values, **kwargs):
         method = values['method']
         if method == 'transformer' and v is None:
             raise ValueError('transformer name or path must be specified')
@@ -73,13 +73,13 @@ def model_name_sane(cls, v: Optional[str], values, **kwargs):
     @validator('tokenizer_name')
     def tokenizer_sane(cls, v: str, values, **kwargs):
         if v is None:
-            return values['model_name_or_path']
+            return values['model']
         return v
 
 
 def construct_t5(options: PassageRankingEvaluationOptions) -> Reranker:
     device = torch.device(options.device)
-    model = T5ForConditionalGeneration.from_pretrained(options.model_name_or_path,
+    model = T5ForConditionalGeneration.from_pretrained(options.model,
                                                        from_tf=options.from_tf).to(device).eval()
     tokenizer = AutoTokenizer.from_pretrained(options.model_type)
     tokenizer = T5BatchTokenizer(tokenizer, options.batch_size)
@@ -89,7 +89,7 @@ def construct_t5(options: PassageRankingEvaluationOptions) -> Reranker:
 def construct_transformer(options:
                           PassageRankingEvaluationOptions) -> Reranker:
     device = torch.device(options.device)
-    model = AutoModel.from_pretrained(options.model_name_or_path,
+    model = AutoModel.from_pretrained(options.model,
                                       from_tf=options.from_tf).to(device).eval()
     tokenizer = SimpleBatchTokenizer(AutoTokenizer.from_pretrained(
         options.tokenizer_name),
@@ -102,7 +102,7 @@ def construct_seq_class_transformer(options: PassageRankingEvaluationOptions
                                     ) -> Reranker:
     try:
         model = AutoModelForSequenceClassification.from_pretrained(
-            options.model_name_or_path, from_tf=options.from_tf)
+            options.model, from_tf=options.from_tf)
     except AttributeError:
         # Hotfix for BioBERT MS MARCO. Refactor.
         BertForSequenceClassification.bias = torch.nn.Parameter(
@@ -110,7 +110,7 @@ def construct_seq_class_transformer(options: PassageRankingEvaluationOptions
         BertForSequenceClassification.weight = torch.nn.Parameter(
             torch.zeros(2, 768))
         model = BertForSequenceClassification.from_pretrained(
-            options.model_name_or_path, from_tf=options.from_tf)
+            options.model, from_tf=options.from_tf)
         model.classifier.weight = BertForSequenceClassification.weight
         model.classifier.bias = BertForSequenceClassification.bias
     device = torch.device(options.device)
@@ -134,7 +134,10 @@ def main():
                      required=True,
                      type=str,
                      choices=METHOD_CHOICES),
-                 opt('--model-name-or-path', type=str),
+                 opt('--model',
+                     required=True,
+                     type=str,
+                     help='Path to pre-trained model or huggingface model name'),
                  opt('--output-file', type=Path, default='.'),
                  opt('--overwrite-output', action='store_true'),
                  opt('--split',
@@ -150,7 +153,7 @@ def main():
                      nargs='+',
                      default=metric_names(),
                      choices=metric_names()),
-                 opt('--model-type', type=str, default='bert-base'),
+                 opt('--model-type', type=str),
                  opt('--tokenizer-name', type=str))
     args = apb.parser.parse_args()
     options = PassageRankingEvaluationOptions(**vars(args))
diff --git a/setup.cfg b/setup.cfg
index 7da1f960..6deafc26 100644
--- a/setup.cfg
+++ b/setup.cfg
@@ -1,2 +1,2 @@
 [flake8]
-max-line-length = 100
+max-line-length = 120