Extraer subtitulos de un DVD con SubRip

En este manual vamos a ver como extraer subtitulos de un DVD con SubRip

Programas a utilizar:

Voy a explicar la forma de extraer subtítulos de un DVD con el programa SubRip, que es la herramienta más sencilla de todas las que he probado.

Abrimos el programa y lo ponemos en español yendo a Options->GUI Language->Spanish (Castellano). Ahora vamos a Archivo->Abrir Vob(s) y nos saldrá esta pantalla:

Extraer subtitulos de un DVD
Ver imagen a tamaño completo

Ahora vamos a Open IFO, como muestra la imagen y nos aparecerá una ventana para seleccionar los IFOs que queremos cargar de nuestro DVD:

Extraer subtitulos de un DVD
Ver imagen a tamaño completo

Para no confundirlos con los *.bup, que se llaman igual pero con diferente extensión, vamos a Tipo y ponemos VTS IFO (vts_*.ifo) (1). De esta manera, sólo nos aparecerán los archivos *.ifo del DVD.
Ahora hay que buscar el IFO correspondiente a nuestra peli. Recordad que en un DVD puede haber varios títulos (con extras y demás). Como podéis comprobar, en nuestro caso tenemos 3 títulos. El título adecuado es el que tenga los VOBs con más peso (de 1GB la mayoría). En nuestro caso, el IFO VTS_01_0.ifo tiene los VOBs De VTS_01_1.vob a VTS_01_7.vob que son los que más tamaño tienen.

NOTA: El archivo VTS_01_0.vob es el menú de ese título.

Una vez elegido el IFO le damos a Abrir y tendremos la pantalla de antes de esta manera:

Extraer subtitulos de un DVD
Ver imagen a tamaño completo

Dejamos marcada la opción Autoseleccionar VOBs que concuerden (1) y como veréis nos quedan marcados todos los VOBs excepto el de menú. Ahora seleccionamos el idioma de subtítulos que queremos que nos extraiga (2) y la acción Subtítulos a texto mediante OCR (3). También debemos elegir en qué formato queremos que nos extraiga los subtítulos. Al pinchar en el botón (4), nos aparecerá una ventana con diferentes formatos y en algunos se puede elegir el color, el tamaño y demás parámetros. Los subtítulos más utilizados son SubRip, Sub Station Alpha y MicroDVD.
Finalmente, podemos hacer que sólo se extraigan los subtítulos hasta un tiempo de la película determinado (5).
En caso de que ya hayamos extraído los subtítulos de este DVD, podemos haber guardado la Matriz de Caracteres y cargarla desde aquí (6). De esto hablaremos más adelante.

Nota: OCR es Reconocimiento Óptico de Caracteres y nos permitirá reconocer cada una de las letras de los subtítulos. Esto también se emplea en el escaneo de documentos de texto.

Bueno, pues una vez hayamos terminado, le damos a Empezar (7).
Ahora nos aparecerá la siguiente ventana:

Extraer subtitulos de un DVD

Como veis, el programa nos muestra el primer carácter que no reconoce (1). Lo que hacemos es introducir por el teclado el carácter correspondiente al que nos muestra el programa (2). Le decimos si queremos que nos lo ponga en Negrita, Cursiva o Subrayado (3) y le damos a Ok (4). Haremos lo mismo con todos los caracteres que no reconozca, de esta manera, todos los caracteres que ya hayan sido introducidos, no volverá a pedírnoslos.
Fijaos también en que los caracteres especiales (símbolos, letras con tildes, Ñs) pueden elegirse en la parte de abajo del todo (5) seleccionando previamente el idioma.

NOTA: Si veis que de repente la ventana empieza a parpadear en rojo, no os preocupéis, es sólo porque hace un tiempo que no le introducís caracteres y se impacienta:)

Cuando ya haya terminado (al cabo de una media hora más o menos para una película de unas 2 horas y media) iremos a la ventana de abajo que parece un intérprete de comandos:

Extraer subtitulos de un DVD
Ver imagen a tamaño completo

Aquí podemos arreglar algún fallo de lectura, como por ejemplo la l y la I, que dependiendo de la letra pueden ser confundidas fácilmente.
Para ello, pulsamos en Corrección post OCR y elegimos las opciones que nos sean de utilidad.

Finalmente, en esa misma ventana, vamos a Archivo->Guardar como y guardamos nuestro subtítulo.

NOTA: Si nos sale esta imagen:

Extraer subtitulos de un DVD
Le decimos que sí, pues si no habrá caracteres que no se guarden correctamente.

Nota 2: Una vez guardado, sería recomendable repasar el texto con una herramienta ortográfica, como la proporcionada por Microsoft Word, para detectar posibles caracteres mal reconocidos.

Por último, vamos a guardar la Matriz de Caracteres en Matriz de Caracteres->Guardar Matriz. Esta matriz, es una tabla donde se guardan los caracteres ya reconocidos, de forma que si tenemos que volver a extraer los subtítulos del mismo DVD, no haya que volverle a indicar los caracteres que van apareciendo. Para cargar la matriz vamos a Matriz de Caracteres->Abrir Matriz.

Nota 3: Esta matriz no nos servirá generalmente para ningún otro DVD.

Un saludo 888

P.D.: Si no os termina de convencer el OCR, podéis extraer los subtítulos de otra forma algo más laboriosa que explico en este tutorial en la parte de Demultiplexado con extensión *.sup. Podéis cambiarlos de formato según se explica en este otro tutorial.