Norm
/

nougat-latex-base

vision-encoder-decoder

Model card Files Files and versions

Norm commited on Oct 10, 2023

Commit

f36f15b

·

1 Parent(s): 8ddd1af

Update README.md

Files changed (1) hide show

README.md +3 -5

README.md CHANGED Viewed

@@ -40,9 +40,8 @@ import torch
 from PIL import Image
 from transformers import VisionEncoderDecoderModel
 from transformers.models.nougat import NougatTokenizerFast
 from nougat_latex import NougatLaTexProcessor
-from nougat_latex.image_processing_nougat import NougatImageProcessor
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # init model
@@ -51,15 +50,14 @@ model = VisionEncoderDecoderModel.from_pretrained("Norm/nougat-latex-base").to(d
 # init processor
 tokenizer = NougatTokenizerFast.from_pretrained("Norm/nougat-latex-base")
-image_processor = NougatImageProcessor.from_pretrained("Norm/nougat-latex-base")
-latex_processor = NougatLaTexProcessor(image_processor=image_processor)
 # run test
 image = Image.open("path/to/latex/image.png")
 if not image.mode == "RGB":
     image = image.convert('RGB')
-pixel_values = latex_processor(image)
 decoder_input_ids = tokenizer(tokenizer.bos_token, add_special_tokens=False,
                               return_tensors="pt").input_ids

 from PIL import Image
 from transformers import VisionEncoderDecoderModel
 from transformers.models.nougat import NougatTokenizerFast
 from nougat_latex import NougatLaTexProcessor
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # init model
 # init processor
 tokenizer = NougatTokenizerFast.from_pretrained("Norm/nougat-latex-base")
+latex_processor = NougatLaTexProcessor.from_pretrained("Norm/nougat-latex-base")
 # run test
 image = Image.open("path/to/latex/image.png")
 if not image.mode == "RGB":
     image = image.convert('RGB')
+pixel_values = latex_processor(image, return_tensors="pt").pixel_values
 decoder_input_ids = tokenizer(tokenizer.bos_token, add_special_tokens=False,
                               return_tensors="pt").input_ids