UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to <undefined> #2

pablonieto0981 · 2021-12-30T20:24:52Z

Any idea how to fix this? I am getting the following error:

File "C:/Users/******/bookNLP.py", line 28, in
booknlp.process(input_file, output_directory, book_id)

File "C:\Users*******\Anaconda3\envs\BookNLP\lib\site-packages\booknlp\booknlp.py", line 17, in process
self.booknlp.process(inputFile, outputFolder, idd)

File "C:\Users******\Anaconda3\envs\BookNLP\lib\site-packages\booknlp\english\english_booknlp.py", line 426, in process
genderEM=GenderEM(tokens=tokens, entities=entities, refs=refs, genders=self.gender_cats, hyperparameterFile=self.gender_hyperparameterFile)

File "C:\Users******\Anaconda3\envs\BookNLP\lib\site-packages\booknlp\english\gender_inference_model_1.py", line 71, in init
self.read_hyperparams(hyperparameterFile)

File "C:\Users******\Anaconda3\envs\BookNLP\lib\site-packages\booknlp\english\gender_inference_model_1.py", line 167, in read_hyperparams
header=file.readline().rstrip()

File "C:\Users*******\Anaconda3\envs\BookNLP\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to

pablonieto0981 · 2021-12-30T20:31:57Z

Just fixed it 👍🏽 > basically did this...

...in booknlp\english\gender_inference_model_1.py changed open(filename) for open(filename, encoding='UTF8') like...

def read_hyperparams(self, filename):
	self.hyperparameters={}
	with open(filename, encoding='UTF8') as file:
		header=file.readline().rstrip()
		gender_mapping={}
		for idx, val in enumerate(header.split("\t")[2:]):
			if val in self.genderID:
				gender_mapping[self.genderID[val]]=idx+2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to <undefined> #2

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to <undefined> #2

pablonieto0981 commented Dec 30, 2021 •

edited

pablonieto0981 commented Dec 30, 2021 •

edited

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to <undefined> #2

UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 1701: character maps to <undefined> #2

Comments

pablonieto0981 commented Dec 30, 2021 • edited

pablonieto0981 commented Dec 30, 2021 • edited

pablonieto0981 commented Dec 30, 2021 •

edited

pablonieto0981 commented Dec 30, 2021 •

edited