-
Notifications
You must be signed in to change notification settings - Fork 1
/
analisis.py
431 lines (346 loc) · 14.1 KB
/
analisis.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
# import the necessary packages
import numpy as np
import imutils
import cv2
import matplotlib.pyplot as plt
def get_center(points):
'''
calcula el punto medio de una nube de puntos 2D.
También admite arrays de 3 coordenadas, como los obtenidos
al buscar contornos con opencv
'''
if len(points.shape) == 3:
x_med = np.mean(points[:,0,0])
y_med = np.mean(points[:,0,1])
return np.array([x_med, y_med])
if len(points.shape) == 2:
x_med = np.mean(points[:,0])
y_med = np.mean(points[:,1])
return np.array([x_med, y_med])
def get_center_y(points):
'''
Calcula la posicion en coordenadas y del centro de una nube de puntos.
se usa como clave para ordenar las columnas de izquierda a derecha.
'''
center = get_center(points)
return center[0]
def get_dist(p1, p2):
'''
Calcula la distancia euclidea entre 2 puntos 2D
'''
d_x = p1[0]-p2[0]
d_y = p1[1]-p2[1]
return np.sqrt(d_x**2 + d_y**2)
def get_submatrix(matrix,rectangle):
'''
Recorta de una matriz un rectángulo de forma aproximada a rectangle
'''
x_max = np.max(rectangle[:,0,0])
x_min = np.min(rectangle[:,0,0])
y_max = np.max(rectangle[:,0,1])
y_min = np.min(rectangle[:,0,1])
return matrix[y_min:y_max,x_min:x_max].copy()
def get_rect_contour(rectangle):
'''
Genera una matriz que contiene los puntos necesarios para
dibujar un rectangulo orientado circunscrito a los
puntos dados.
'''
x_max = np.max(rectangle[:,0,0])
x_min = np.min(rectangle[:,0,0])
y_max = np.max(rectangle[:,0,1])
y_min = np.min(rectangle[:,0,1])
rect = np.array([
[x_max, y_max],
[x_max, y_min],
[x_min, y_min],
[x_min, y_max],
[x_max, y_max]
])
return rect
def enderezar(mat, direction):
'''
Reorienta una matriz dependiendo de la dirección
'''
if direction == 0:
return mat
if direction == 1:
return mat.T[:,::-1]
if direction == 2:
return mat[::-1,::-1]
if direction == 3:
return mat.T[::-1,:]
def get_rectangles(image):
'''
Obtiene una lista de los contornos rectangulares
ordenados de mayor a menor
'''
# find contours in the edge map, then initialize
# the contour that corresponds to the document
cnts = cv2.findContours(image.copy(), cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if imutils.is_cv2() else cnts[1]
rectangulos = []
# ensure that at least one contour was found
if len(cnts) > 0:
# sort the contours according to their size in
# descending order
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
# loop over the sorted contours
for c in cnts:
# approximate the contour
peri = cv2.arcLength(c, True)
approx = cv2.approxPolyDP(c, 0.02 * peri, True)
# if our approximated contour has four points,
# then we can assume we have found the paper
if len(approx) == 4:
rectangulos.append(approx)
return rectangulos
def get_orientation(rectangle):
'''Calcula la orientación vertical u horizontal
de un rectángulo dado
'''
big_r_p0 = rectangle[0,0,:]
big_r_p1 = rectangle[1,0,:]
big_r_p2 = rectangle[2,0,:]
big_r_l1 = get_dist(big_r_p0, big_r_p1)
big_r_l2 = get_dist(big_r_p1, big_r_p2)
big_r_p_far = big_r_p0 if big_r_l1>big_r_l2 else big_r_p2
big_r_long = np.abs(big_r_p_far - big_r_p1)
if big_r_long[0] > big_r_long[1]:
orientation, coord = 'hor', 0
else:
orientation, coord = 'vert', 1
big_r_long_sign = big_r_p_far - big_r_p1
angle = np.rad2deg(np.arctan(big_r_long_sign[1-coord]/big_r_long_sign[coord]))
angle = -angle if orientation == 'hor' else angle
return orientation, coord, angle
def get_direction(image, rectangulos, coord, orientation):
'''
Obtiene la direccion del folio a partir de medir
a qué lado de las columnas hay mayor cantidad de tinta.
devuelve la direccion como un int:
0 = de pie
1 = girado a la derecha
2 = girado 180º
3 = girado a la izquierda
'''
min_coord = max(image.shape)
max_coord = 0
for ii in range(5):
element = rectangulos[ii]
min_coord = min(min_coord, np.min(element[:,0,coord]))
max_coord = max(max_coord, np.max(element[:,0,coord]))
#Calculamos la luminosidad de los espacios a ambos lados de las columnas
corner_space_1 = np.array(image.shape)-1
corner_space_1[1 - coord] = min_coord
space_1 = image[:corner_space_1[0], :corner_space_1[1]]
corner_space_2 = np.array([0,0])
corner_space_2[1 - coord] = max_coord
space_2 = image[corner_space_2[0]:, corner_space_2[1]:]
#El lado más oscuro es la cabecera
if orientation == 'vert':
if np.mean(space_1) < np.mean(space_2):
direction = 0
else:
direction = 2
else:
if np.mean(space_1) < np.mean(space_2):
direction = 1
else:
direction = 3
return direction
def giro_recorte(image, angle):
'''
Gira una imagen y recorta los márgenes necesarios
para que no aparezca información espurea en las esquinas.
'''
if abs(angle)>0.05:
rows,cols = image.shape
M = cv2.getRotationMatrix2D((cols/2,rows/2),-angle,1)
giro_rect = cv2.warpAffine(image,M,(cols,rows))
margins = np.ceil(np.array(image.shape)*np.sin(np.deg2rad(abs(angle)))).astype(int)
giro_margin = giro_rect[margins[0]:-margins[0], margins[1]:-margins[1]]
else:
giro_margin = image
return giro_margin
def analizar_casilla(n, casillas):
'''
Calcula una fila de datos tras analizar la pregunta
'''
#La fila de datos se compodrá del número de la pregunta,
#la solución propuesta y posibles alertas.
fila = [n+1,]
sol_casilla = ''
alerta_casilla = ''
malas_casillas = ''
#Obtenemos la imagen de la casilla a analizar y la difuminamos
pregunta_prev = casillas[n]
pregunta = cv2.GaussianBlur(pregunta_prev, (35, 35), 0)
#Definimos las secciones de la imagen que analizamos en busca de
#trazos escritos
alto,ancho = pregunta.shape
alto_cas = round(alto/1.737)
ancho_cas = round(ancho/7.768)
y_cas = round(alto/2.543)
x_cas = round(ancho/3.633)
ancho_pos = round((ancho - x_cas)/4)
#Guardamos en una lista las imágenes de las casillitas
#de respuesta que se van a medir
recuadros = []
for ii in range(4):
recuadros.append(pregunta[y_cas:y_cas + alto_cas,x_cas+ ii*ancho_pos: x_cas + ancho_cas+ ii*ancho_pos ])
#Guardamos el valor de la luminosidad media de cada casilla
medias_cuadros = []
for ii in range(4):
medias_cuadros.append(recuadros[ii].mean())
#Comparamos la luminosidad de cada casilla con la de la
#casilla más clara de la pregunta.
#Suponemos que si la diferencia pasa de cierto umbral, es porque
#la casilla ha sido oscurecida por trazos escritos.
#Además, supondremos que de todas las casillas con trazos,
#la más clara es la correcta, ya que para anular se escriben
#trazos adicionales en la casilla.
num_found = 0 #Número de casillas con trazos
found_cell_value = 500 #Guardaremos el valor más claro de casilla con trazos
found_bad_cell_value = 500 #Esto nos sirve para guardar valores de casillas anuladas
for ii in enumerate('ABCD'):
dif = medias_cuadros[ii[0]]-min(medias_cuadros)
if dif > 11:
num_found += 1 #Hemos encontrado una casilla con trazos
if dif < found_cell_value: #Si es la más clara, es la buena
found_bad_cell_value = found_cell_value
found_cell_value = dif
malas_casillas += sol_casilla
sol_casilla = ii[1]
else:
found_bad_cell_value = min(found_bad_cell_value, dif)
malas_casillas += ii[1]
if 11 < dif <= 13 and len(alerta_casilla) == 0: #dejamos un margen de duda
alerta_casilla += 'cuadros dudosos: ' + ii[1] + ' '
#Añadimos alerta por múltiples respuestas si es necesario
if num_found >= 2:
alerta_casilla += 'varias respuestas detectadas: ' + str(num_found)
#La luminosidad de casillas que consideramos como respuesta
#se guarda para hacer más análisis después.
if num_found >= 1:
ok_cell_value = found_cell_value
else:
ok_cell_value = max(medias_cuadros)
fila.append(sol_casilla)
fila.append(alerta_casilla)
fila.append(malas_casillas)
return fila, ok_cell_value
def gen_corr_image(image, solucion, rectangulos, root):
root_divided = root.split('/')
new_root = 'examenes_coloreados/' + root_divided[-1]
plt.figure(figsize=[20,30])
plt.imshow(image, cmap=plt.cm.gray)
letras = {'A':0, 'B':1, 'C':2, 'D':3}
for n in range(5):
rectangle = rectangle = get_rect_contour(rectangulos[n])
plt.plot(rectangle[:,0], rectangle[:,1],'r', lw = 2)
for n in range(5):
rectangle = rectangulos[n][:,0,:]
x_max = np.max(rectangle[:,0])
x_min = np.min(rectangle[:,0])
y_max = np.max(rectangle[:,1])
y_min = np.min(rectangle[:,1])
alto = (y_max - y_min)/20
ancho = x_max - x_min
for ii in range(20):
jj = n*20 + ii
y_center = y_min + alto * (ii)
if len(solucion[jj][2])>0:
plt.bar(x_min + ancho/2, alto * 0.7, ancho , y_center, alpha = 0.3, color = 'y')
if len(solucion[jj][1])>0:
alto_cas = (alto/1.737)
ancho_cas = (ancho/7.768)
y_cas = (alto/2.543)
x_cas = (ancho/3.633)
ancho_pos = ((ancho - x_cas)/4)
kk = letras[solucion[jj][1]]
plt.bar(x_min +x_cas+ kk*ancho_pos + ancho_cas/2 , alto_cas, ancho_cas ,
y_center + y_cas, alpha = 0.5, color = 'g')
if len(solucion[jj][3])>0:
malas = solucion[jj][3]
for mala in malas:
kk = letras[mala]
plt.bar(x_min +x_cas+ kk*ancho_pos + ancho_cas/2 , alto_cas, ancho_cas ,
y_center + y_cas, alpha = 0.5, color = 'r')
plt.axis('off')
plt.savefig(new_root, bbox_inches = 'tight')
def evaluar(root):
'''
Calcula la lista de respuestas de una imagen contenida en root.
También analiza posibles problemas de la lectura.
'''
# Cargamos la imagen desde root:
image = cv2.imread(root)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (11, 11), 0)
thresh = cv2.threshold(blurred, 0, 255,
cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
#Buscamos contornos rectangulares
rectangulos = get_rectangles(thresh)
#Calculamos la orientación vertical u horizontal del folio
orientation, coord, angle = get_orientation(rectangulos[0])
#Calculamos la orientación exacta del papel
direction = get_direction(gray, rectangulos, coord, orientation)
#Giramos la imagen para que quedeuna hoja perfectamente vertical
giro_margin = giro_recorte(blurred, angle)
papel = enderezar(giro_margin, direction)
#Binarizamos la imagen con un threshold
thresh = cv2.threshold(papel, 0, 255,
cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
#Obtenemos la posición de las columnas
rectangulos = get_rectangles(thresh)
rectangulos = sorted(rectangulos[:5], key=get_center_y, reverse=False)
#Guardamos las columnas en sí en una lista
columns_gray_ok = []
for ii in range(5):
columns_gray_ok.append(get_submatrix(thresh, rectangulos[ii]))
#Columna a columna, guardamos todas las casillas en un lista
casillas = []
for n in range(5):
long = columns_gray_ok[n].shape[0]
for ii in range(20):
long_y = (long/20)
min_y = round(long_y*ii)
max_y = round(min_y + long_y)
casillas.append(columns_gray_ok[n][min_y:max_y,:])
#Analizamos cada casilla a priori
solucion = []
ok_cell_list = []
for n in range(100):
fila, ok_cell_value = analizar_casilla(n, casillas)
ok_cell_list.append(ok_cell_value)
solucion.append(fila)
#Con los datos obtenidos, podemos buscar información adicional
#por ejemplo, buscar posibles respuestas tachadas a partir
#de casillas tomadas como correctas anormalmente oscuras
ok_cell_max = sorted(ok_cell_list, reverse = True)
ok_cell_difs = [ok_cell_max[ii] - ok_cell_max[ii+1] for ii in range(7)]
#---- Codigo para debuggear o sacar info adicional ---------
# ok_cell_avg = np.mean(ok_cell_list)
# for line in solucion:
# alerta_casilla = line[2]
# if len(alerta_casilla) > 0:
# alerta_casilla += ' ok-avg: ' + str(round(ok_cell_avg, 3))
# alerta_casilla += ' ok-max: ' + str(round(ok_cell_max[0], 3))
# alerta_casilla += ' difs: '
# for ii in range(5):
# dif_cell = ok_cell_difs[ii]
# alerta_casilla += str(round(dif_cell, 3)) + ' '
# line[2] = alerta_casilla
#---- Fin del bloque adicional --------------
max_cell_acc = ok_cell_max[0] + 10
for ii in enumerate(ok_cell_difs):
if ii[1] > 7:
max_cell_acc = ok_cell_max[ii[0]]
for ii in enumerate(ok_cell_list):
if ii[1]>= max_cell_acc:
solucion[ii[0]][2] += 'posible casilla tachada'
gen_corr_image(papel, solucion, rectangulos, root)
#Se devuelven todos los datos obtenidos
return solucion