Mejorar script para encontrar diferencias de formato #1783

cmaureir · 2021-12-20T11:31:20Z

Este script puede ser utilizaro en archivos, directorios,
o en todo el proyecto (sin argumentos)

La idea es encontrar inconsistencias en los archivos traducidos
relacionados al formato de rst y sphinx.

Este script puede ser utilizaro en archivos, directorios, o en todo el proyecto (sin argumentos) La idea es encontrar inconsistencias en los archivos traducidos relacionados al formato de rst y sphinx.

rtobar

Un par de detalles, el resto se ve bien.

Al leer el código para tratar de entender la funcionalidad de cumple, me recordó a los checks que hace sphinx mismo de asegurarse que los roles que aparecen en el original también aparecen en la traducción (y que hacen fallar el build cuando no se cumple).

¿Es la intención de este script hacer ese mismo chequeo, pero de forma más light de tal forma que se pueda agregar al pre-commit? Si la respuesta es "sí", entonces creo que sacaría los patrones de bold e italics porque esos dan varios falsos positivos, y además ajustaría la lógica para que el texto dentro de los roles no tenga que ser exactamente igual, sino que la referencia tenga que ser la misma (i.e., parsear lo que hay dentro de <> si es que están presentes los caracteres).

Por otro lado, si la intención inicial no era esa, sino más bien dar un feedback más manual, qué tal si ajustamos el script para que tenga las dos funcionalidades? O creamos uno aparte? Voy a experimentar un poco y poner acá mis resultados.

scripts/format_differences.py

cmaureir · 2022-10-25T11:47:52Z

Un par de detalles, el resto se ve bien.

Gracias por los comentarios, había olvidado este parche :P

Al leer el código para tratar de entender la funcionalidad de cumple, me recordó a los checks que hace sphinx mismo de asegurarse que los roles que aparecen en el original también aparecen en la traducción (y que hacen fallar el build cuando no se cumple).

¿Es la intención de este script hacer ese mismo chequeo, pero de forma más light de tal forma que se pueda agregar al pre-commit? Si la respuesta es "sí", entonces creo que sacaría los patrones de bold e italics porque esos dan varios falsos positivos, y además ajustaría la lógica para que el texto dentro de los roles no tenga que ser exactamente igual, sino que la referencia tenga que ser la misma (i.e., parsear lo que hay dentro de <> si es que están presentes los caracteres).

Complementario diría yo,
sphinx no detecta inconsistencias entre los bold e italic por ejemplo, que por lo general terminan en errores de formato.
Agregué los patrones de otras sentencias de sphinx "ya que estamos buscando inconsistencias". Pensé que si alguien lo usa, querrá notar las otras diferencias también.

Por otro lado, si la intención inicial no era esa, sino más bien dar un feedback más manual, qué tal si ajustamos el script para que tenga las dos funcionalidades? O creamos uno aparte? Voy a experimentar un poco y poner acá mis resultados.

No pensé realmente un uso de todas las personas, solamente que estaba haciendo el paso a mano de buscar inconsistencias entre frases donde quien haya traducido olvidara texto en bold, o alguna otra cosa de sphinx que se nos hubiera pasado por alto.

Si tienes alguna idea de como mejorarla para dar esa dualidad me dices!

humitos · 2022-10-28T09:09:24Z

scripts/format_differences.py

+    ":c:func:`[^`]+`",
+    ":c:type:`[^`]+`",
+    ":c:macro:`[^`]+`",
+    ":c:member:`[^`]+`",
+    ":c:data:`[^`]+`",
+    ":py:data:`[^`]+`",
+    ":py:mod:`[^`]+`",
+    ":func:`[^`]+`",
+    ":mod:`[^`]+`",


Yo creo que esto se podría escribir de una forma más genérica usando más regex:

: +[a-z]+:`[a-z]+`

Esa por ejemplo, encuentra "uno o más espacios luego del primer :"

:[a-z]+: +`[a-z]+`

Encuentra un "un espacio luego del segundo :"

De esta forma, solo tenemos que escribir "un par de regex" para encontrar los espacios en todas las posibles variaciones de todos los roles de Sphinx. ¿Qué te parece? Lo mismo se puede hacer para cursiva y negrita.

Mejorar script para encontrar diferencias de formato

526a3f2

Este script puede ser utilizaro en archivos, directorios, o en todo el proyecto (sin argumentos) La idea es encontrar inconsistencias en los archivos traducidos relacionados al formato de rst y sphinx.

rtobar reviewed Dec 21, 2021

View reviewed changes

scripts/format_differences.py Outdated Show resolved Hide resolved

scripts/format_differences.py Outdated Show resolved Hide resolved

Arreglando comentarios revisión

518517d

cmaureir changed the base branch from 3.10 to 3.11 October 26, 2022 11:47

Merge branch '3.11' into format_diff_update

981ac28

humitos reviewed Oct 28, 2022

View reviewed changes

cmaureir mentioned this pull request Nov 15, 2022

Using sphinx-lint #2200

Closed

cmaureir changed the base branch from 3.11 to 3.12 October 14, 2023 11:45

Merge branch '3.12' into format_diff_update

5dbf45e

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Mejorar script para encontrar diferencias de formato #1783

Mejorar script para encontrar diferencias de formato #1783

cmaureir commented Dec 20, 2021

rtobar left a comment

cmaureir commented Oct 25, 2022

humitos Oct 28, 2022 •

edited

Mejorar script para encontrar diferencias de formato #1783

Are you sure you want to change the base?

Mejorar script para encontrar diferencias de formato #1783

Conversation

cmaureir commented Dec 20, 2021

rtobar left a comment

Choose a reason for hiding this comment

cmaureir commented Oct 25, 2022

humitos Oct 28, 2022 • edited

Choose a reason for hiding this comment

humitos Oct 28, 2022 •

edited