Pablo
Valladares, investigador y académico de la Universidad de Tarapacá, es
uno de los que primero prendió las alarmas sobre la PSU. En 2005, cuando
era coordinador de Ciencias en el DEMRE, sostuvo que el mecanismo usado
para calcular los puntajes en esa prueba era “poco ético” pues
alteraba la calificación de los alumnos. Aquello fue parte de una
intensa discusión sobre la validez de la PSU que se dio entre académicos
y sin que la opinión pública se enterara. “El proceso de cambio de la
PAA a la PSU fue encabezado por economistas, sicólogos, académicos,
todos con militancia política, pero ¡nadie! experto en evaluación ni en
educación. Por eso el descalabro que ha ocurrido con estos procesos”,
dice.
Si usted no es ingeniero o matemático es muy difícil que entienda esta forma de evaluación.
Pablo Valladares, investigador y académico de la Universidad de
Tarapacá, es uno de los que primero prendió las alarmas sobre la PSU. En
2005, cuando era coordinador de Ciencias en el DEMRE, sostuvo que el
mecanismo usado para calcular los puntajes en esa prueba era “poco
ético” pues alteraba la calificación de los alumnos dependiendo de si
habían decidido contestar el electivo de Química o el de Biología. “Se
les aumentó artificialmente la puntuación a los que rindieron Biología y
se les disminuyó a los que optaron por Química”, escribió en una carta
que envió a Graciela Donoso, jefa unidad de investigación del DEMRE (Ver carta).
El texto de Valladares forma parte de una intensa discusión sobre la
validez de la PSU que se dio entre académicos y sin que la opinión
pública ni los alumnos se enteraran. En esta disputa las decisiones
finales no siempre fueron el resultado de un debate científico. Para
Valladares, una de las razones del problema actual de la PSU es que se
omitió una mirada educacional sobre el sistema. “El proceso de cambio de
la PAA a la PSU fue encabezado por economistas, sicólogos, académicos
de distintas áreas, todos con militancia política, pero ¡nadie! experto
en evaluación ni en educación. Ningún doctor en educación ni evaluación.
Por eso el descalabro que ha ocurrido con estos procesos”.
-El argumento central de su crítica es que en la PSU se baja
el puntaje de los que optaron por rendir la prueba de Química y sube la
puntuación de los que escogieron Biología. ¿Por qué se hace eso? Un
ejemplo puede ayudar a entender el problema. Hagamos cuenta que usted,
su editora y yo rendimos la PSU de Ciencias. Los tres respondemos las
mismas 10 preguntas del módulo común. Luego usted rinde la electiva de
Química, su colega la de Física y yo la de Biología, pero ninguno de los
tres responde ninguna pregunta del electivo. Es decir, nos quedamos
sólo con las 10 preguntas del módulo común. Lógicamente los tres
deberíamos tener el mismo puntaje, pero no es así. Usted, que rindió
Química tendrá menor puntaje; segundo su editora, que rindió Física; y
yo, que rendí Biología, tendré el mayor puntaje. Ahora, si los tres
estamos postulando a Medicina: ¿quién se ve beneficiado? Más aún, si
estamos los tres en el puntaje de corte, quién dio la PSU de
Ciencias-Biología se vio beneficiado. Escuché en alguna oportunidad que
había un análisis de cuantos postulantes se habían visto beneficiados o
perjudicados por esta situación en uno de los procesos que participé,
pero no vi ningún informe.
-¿Por qué se calcula de ese modo?
El error fue pasar de PAA a PSU sin tener el material necesario, ni los equipos técnicos especializados.
Es lo que decidieron hacer para resolver el problema de tener un solo
puntaje en Ciencias, con independencia del electivo que se haya dado.
Lo que ocurre es que, cuando se correlaciona el puntaje de Ciencias con
la PSU de Lenguaje por un lado, y con la de Matemáticas por otro, se
observan claramente tres grupos: los que rinden la electiva de Química,
que son los que tienen mejores resultados; los del electivo de Física,
que tienen resultados intermedios; y los del electivo de Biología, que
tienen los más bajos resultados. Las razones de estas diferencias son
muchas. Una de ellas es que el número de contenidos en Química y Física
son alrededor de 60, mientras que los de Biología son sobre 100, por lo
que prepararse para la PSU de Ciencias es más difícil si uno rinde
Biología. Pero lo importante es que hay tres grupos distintos de alumnos
que no pueden ser comparados entre sí con un mismo puntaje. Sin
embargo, las autoridades de la época consideraron necesario calcular un
solo puntaje para todos. Por ello, el algoritmo desarrollado por Jorge
Manzi, David Bravo (Nota de R. Ambos son los autores de la PSU e integran el Comité Técnico Asesor (CTA) que asesora al CRUCH en el tema de la PSU)
y otros, ajustaron los puntajes a Física. De esta manera, por lo menos
hasta que estuve ahí, en 2007, se bajó la escala de puntaje a los que
rindieron la electiva de Química, se les aumentó a los que contestaron
la electiva de Biología, y Física quedó igual. Uno de los problemas que
genera esta forma de cálculo es que a medida que
aumentan los puntajes, la brecha se hace más alta, y por lo tanto las
diferencias son más significativas. Como estos puntajes pelean punto a
punto la entrada a las carreras más emblemáticas, como Medicina,
variaciones como estas son muy complejas. Este mecanismo fue cuestionado
en un informe que desarrolló la Doctora Nancy Lacourly de la Facultad
de Ingeniería de la Chile; también los colegas del Educational Testing
Service (ETS) compartían nuestras aprensiones. Ellos incluso les dijeron
a David Bravo y Jorge Manzi, en una reunión a la que tuve la
oportunidad de asistir, que publicaran en una revista científica dicho
algoritmo para que fuera evaluado por pares internacionales
independientes. No sé si esto se hizo. Por mi parte, les pedí en una
reunión que esto se transparentara a la opinión pública, y David me dijo
que eso no era necesario. Desde el inicio fue controvertida la forma
del cálculo de este examen.
-¿Cómo se originó este método de cálculo? No
sé cómo se origina el algoritmo, pero lógicamente se pensó primero en
la estructura de la prueba (un módulo común que mezcla contenidos de
tres áreas científicas distintas, y un módulo específico) y después
vieron como solucionar el tema del puntaje único, cuando lo inteligente
debió ser lo contrario. Es decir, solo buscaron un algoritmo para
calcular un sólo puntaje de test que corresponde a un engendro raro,
difícil de entender. Si usted no es ingeniero o matemático, es muy
difícil que entienda esta forma de evaluación. -
¿Puede ser una propuesta hecha por el Comité Técnico Asesor (CTA)? No
lo sé. Solo sé que ellos intervinieron fuertemente en las decisiones de
esta prueba. Después de cada examen analizaban las estadísticas de cada
ítems y decidían, por ejemplo, si se anulaban o no las preguntas con
resultados estadísticos que no se ajustaban a lo que deseaban del
instrumento. Siempre me opuse rotundamente a eso.
-¿Es el CRUCH la entidad donde se decidió usar este cálculo? No
lo creo. Me parece que parte del problema es que las universidades no
se han hecho parte lo suficiente en esta discusión. Mientras estuve en
el DEMRE nunca recibimos una consulta de algún representante de alguna
universidad del CRUCH preguntándonos algún detalle técnico. Nunca
participaron con nosotros representantes del CRUCH en las discusiones
profundas del sistema, sólo en la construcción de ítems para enriquecer
los bancos de preguntas. Es importante mencionar que cada universidad
del CRUCH tiene un representante en el DEMRE, pero hasta donde sé,
siempre estaban a cargo de organizar la toma de la PSU y el pre-test,
pero nunca de participar en discusiones estructurales de la misma.
-En su carta de 2005 usted propuso, para
solucionar este problema, entregar puntajes separados para cada una de
las pruebas dejando que las universidades ponderaran de acuerdo a sus
intereses. En esa línea iba, según entiendo, la propuesta hecha por la
auditoría ETS hecha también el 2005. Así es, y también
concluyó lo mismo la Dra. Lacourly de Ingeniería. Ya éramos tres,
DEMRE, ETS y la Dra. Lacourly, quienes por separado, concluimos lo
mismo, y siempre se les comunicó a David Bravo y Jorge Manzi nuestros
análisis. Sin embargo, no fuimos considerados. Nunca entendí que había
detrás de esto. Solo me llamaba la atención que por esa fecha salían los
primeros resultados de Ciencias en pruebas internacionales, donde los
resultados eran paupérrimos. Por otra parte siempre nos llamó
profundamente la atención que quienes encabezaron el proceso de cambio
de PAA a PSU fueron economistas, sicólogos, académicos de distintas
áreas, todos con militancia política, pero ¡nadie! experto en evaluación
ni en educación. Ningún doctor en educación ni evaluación. Por eso el
descalabro que ha ocurrido con estos procesos.
El proceso de cambio de PAA a PSU fueron economistas, sicólogos, académicos de distintas áreas, todos con militancia política, pero ¡nadie! experto en evaluación ni en educación. Ningún doctor en educación ni evaluación. Por eso el descalabro que ha ocurrido con estos procesos.
-Hasta que usted estuvo en el DEMRE, ¿se
debatieron otros problemas que se han descrito en la PSU? Por ejemplo,
¿recuerda si se discutió el problema de los estudiantes de Liceos
Técnico-Profesionales que no pueden rendir correctamente una PSU que
abarca toda la Enseñanza Media pues su currículum incluye el contenido
sólo hasta 2do Medio?
Discutimos miles de cosas, desde la organización interna, pasando por la liberación de información a la opinión pública, hasta los bancos de preguntas, la informatización, etc. Por ejemplo, los bancos de ítems no estaban preparados para el cambio de PAA a PSU, no existía un número de preguntas que nos permitieran desarrollar un instrumento como el que teóricamente se requería. Con el tiempo pudimos construir un buen banco de preguntas, fue un gran trabajo que se desarrolló en el DEMRE. Inicialmente debíamos construir una PSU en base a preguntas que nos harían llegar del proyecto SIES, sin embargo, lo que nos llegó de ese proyecto fue un chiste. Al menos a Biología nos llegaron 77 preguntas, de las cuales rechazamos el 90% por errores técnicos y conceptuales, y lo que dejamos eran solo preguntas de reconocimiento, es decir, preguntas sencillas, que requerían solo recordar una estructura o función para responderla correctamente. Ahí no había nada que nos permitiera desarrollar una PSU como teóricamente se requería. Pienso que el error fue pasar de PAA a PSU sin tener el material necesario, ni los equipos técnicos especializados. Por ejemplo, en el Comité de Ciencias éramos sólo tres personas, sin contar los académicos externos. No teníamos bancos de preguntas, no existían bases de datos computacionales, ni siquiera teníamos computadores en nuestras oficinas, ¡trabajamos con tarjetas de cartón! Ahí el trabajo de Omar Flores fue fundamental, quién convenció de modernizar al DEMRE y sus comités. Por otro lado tuvimos cursos de especialización en estadística, vinieron los colegas del ETS a darnos conferencias, algunos colegas tuvieron la suerte de viajar a especializarse en el ETS en USA, etc. Después que me fui, se aumentó el número de personas en el Comité de Ciencias, pero ya habían transcurridos tres procesos de admisión a las universidades. Los constantes errores que se produjeron tanto en procesos de admisión como pre-test fue consecuencia, a mi juicio, en gran medida de este déficit. Pero respondiendo a su pregunta, no recuerdo discusiones sobre una prueba para alumnos de Liceos Técnicos-Profesionales. Sí supe que hubo una comisión que trabajó menos de un año en una propuesta, pero nunca supimos que fue de ellos, ni que resultado se obtuvo de su trabajo.
Discutimos miles de cosas, desde la organización interna, pasando por la liberación de información a la opinión pública, hasta los bancos de preguntas, la informatización, etc. Por ejemplo, los bancos de ítems no estaban preparados para el cambio de PAA a PSU, no existía un número de preguntas que nos permitieran desarrollar un instrumento como el que teóricamente se requería. Con el tiempo pudimos construir un buen banco de preguntas, fue un gran trabajo que se desarrolló en el DEMRE. Inicialmente debíamos construir una PSU en base a preguntas que nos harían llegar del proyecto SIES, sin embargo, lo que nos llegó de ese proyecto fue un chiste. Al menos a Biología nos llegaron 77 preguntas, de las cuales rechazamos el 90% por errores técnicos y conceptuales, y lo que dejamos eran solo preguntas de reconocimiento, es decir, preguntas sencillas, que requerían solo recordar una estructura o función para responderla correctamente. Ahí no había nada que nos permitiera desarrollar una PSU como teóricamente se requería. Pienso que el error fue pasar de PAA a PSU sin tener el material necesario, ni los equipos técnicos especializados. Por ejemplo, en el Comité de Ciencias éramos sólo tres personas, sin contar los académicos externos. No teníamos bancos de preguntas, no existían bases de datos computacionales, ni siquiera teníamos computadores en nuestras oficinas, ¡trabajamos con tarjetas de cartón! Ahí el trabajo de Omar Flores fue fundamental, quién convenció de modernizar al DEMRE y sus comités. Por otro lado tuvimos cursos de especialización en estadística, vinieron los colegas del ETS a darnos conferencias, algunos colegas tuvieron la suerte de viajar a especializarse en el ETS en USA, etc. Después que me fui, se aumentó el número de personas en el Comité de Ciencias, pero ya habían transcurridos tres procesos de admisión a las universidades. Los constantes errores que se produjeron tanto en procesos de admisión como pre-test fue consecuencia, a mi juicio, en gran medida de este déficit. Pero respondiendo a su pregunta, no recuerdo discusiones sobre una prueba para alumnos de Liceos Técnicos-Profesionales. Sí supe que hubo una comisión que trabajó menos de un año en una propuesta, pero nunca supimos que fue de ellos, ni que resultado se obtuvo de su trabajo.
-¿Piensa usted que a los alumnos de los
establecimientos Técnicos Profesionales y a los de muchos
establecimiento municipales que no alcanzan a ver todo el currículum que
entra en la PSU, los perjudica una prueba que crecientemente tiene
contenidos vistos en toda la Enseñanza Media? Lógicamente que
sí, los perjudica claramente, ya que la prueba se construye a partir de
una matriz constituida por contenidos, habilidades y dificultades. Quién
no estudie los contenidos, mal podrá responder las preguntas de
habilidades cognitivas importantes o profundas, y consecuentemente de
mayor dificultad. Por lo tanto sus puntajes siempre se mantendrán por
debajo del promedio.
En una reunión los colegas del Educational Testing Service les dijeron a David Bravo y a Jorge Manzi que publicaran en una revista científica el algoritmo usado en Ciencias, para que fuera evaluado por pares internacionales independientes. No sé si esto se hizo.
-¿Se discutió en el DEMRE o con la CTA o
en el Cruch la capacidad predictiva que tenía la prueba y que ha sido
puesta en duda especialmente por Mónica Silva y Mlanden Koljatic? Sí,
se discutió. Y la verdad, nos llegaban los análisis de David Bravo,
donde concluía que estos instrumentos eran muy buenos predictores. Si
bien nunca nos convencimos mucho de ello, debo reconocer que mi
experiencia como académico en universidades privadas y estatales me hizo
considerar la efectiva predicción del instrumento, pero eso era sólo
una experiencia personal. De los autores que usted menciona, siempre
leímos y discutimos los artículos que publicaban, y personalmente les
encontraba mucha razón, sus argumentos técnicos eran muy profundos y
serios. Lamentablemente, el DEMRE nunca hizo un análisis serio e
independiente, al menos hasta donde recuerdo.
-A la luz de los antecedentes que se han
ido reuniendo, ¿le parece que la PSU selecciona a los alumnos más
capacitados para estudiar en la universidad? En cierta forma
sí, pero esto tiene muchos bemoles. Más allá de ser un buen predictor,
lo que sí queda claro es que refleja las desigualdades que existen en la
educación chilena, y uno de sus argumentos era precisamente disminuir
la brecha entre los colegios privados de los públicos, y eso no ha
sucedido con este instrumento.