¿Está de acuerdo con los criterios de admisión para Sigma III, Sigma IV y Sigma V?

Así que hay varios problemas con la prueba y su pregunta que puedo tratar de resolver. Comenzaré con su pregunta, luego pasaré a algunos de los pensamientos que tengo sobre la Prueba de Sigma (como no experto).

Advertencia 1 : aunque tengo una formación de posgrado en teoría de pruebas (específicamente, teoría de respuestas de elementos), de ninguna manera soy un experto. Apreciaría los comentarios de personas con más conocimiento de la inteligencia humana / teoría de pruebas.

Advertencia 2 : La página de LinkedIn de Melão Jr. menciona el trabajo realizado como consultor para una empresa de pruebas psicométricas. Dada la descripción de su trabajo, creo que es seguro asumir que está familiarizado con la teoría de pruebas clásica y la teoría de respuesta de elementos. Si bien muchos de mis problemas a continuación están relacionados con la información que no está disponible en el sitio web de la prueba (validez, etc.), es posible que esta información no esté disponible públicamente simplemente porque Melão no creyó que fuera la información necesaria para el lego.

Advertencia 3 : utilicé Google Translate para leer la documentación no traducida provista. Como las traducciones proporcionadas no son perfectas, es posible que algunos de mis problemas ya hayan sido resueltos por los testmakers. Por ejemplo, el documento del método de puntuación hace referencia a la g de Spearman (capacidad mental general) y algún tipo de ajuste, pero no pude entender de qué se estaba hablando.


Primero, una definición fundamental para reducir la ambigüedad y asegurar que todos estemos en la misma página:

IQ y ‘inteligencia’ no son lo mismo. IQ es (una de muchas) medidas de inteligencia estandarizadas que se estandarizan para tener una media de 100 y una desviación estándar de 15 (al menos en algunas interpretaciones).

Por lo tanto, si desea analizar otros métodos para medir la inteligencia (o la capacidad mental en general, o como se llame), sería más exacto describirlos como “pruebas de inteligencia” en lugar de “pruebas de CI”. Ahora que está fuera del camino, podemos seguir adelante.

Su enfoque del coeficiente intelectual y la medición de la inteligencia es mucho más coherente que todo lo que he visto hasta ahora; y, como la mayoría de las pruebas de CI son incompetentes para diferenciar los resultados por encima del 2,2% superior, es realmente bueno tener algo que pueda ir más allá de eso con cierta precisión.

Este sentimiento en su pregunta llega a un atributo fundamental de las pruebas conocido como discriminación , que describe qué tan buena es una prueba para diferenciar entre individuos de nivel de habilidad similar. Esencialmente, usted está diciendo que la Prueba de Sigma es más “coherente” porque es más discriminatoria para las personas que se encuentran en el extremo más alto del espectro de inteligencia. ¿Pero esto significa que es mejor? Tenga en cuenta que el coeficiente de inteligencia debe tener una media de 100 y un SD de 15. ¡Esto significa que las personas con un coeficiente intelectual de más de 145 deben representar menos del 0,1% de la población! Las pruebas estandarizadas de IQ simplemente no pretenden discriminar los valores extremos. Ese no es el propósito de la prueba.

El Test de Sigma tiene 35 problemas y uno adicional que aún no se ha resuelto.

Hay dos problemas aquí. Primero: esta prueba solo tiene 35 elementos. Tengo que preguntarme cómo se dan las puntuaciones válidas a un banco de pruebas tan pequeño. Segundo: un elemento que ha sido respondido correctamente por cero personas exactamente tiene una potencia de diagnóstico exactamente cero. Es el mismo principio en cuanto a por qué un ítem del 100% de las personas responde correctamente y no le dice nada: no hay poder discriminatorio. Esto me lleva a dudar de cómo se validó esta prueba. (Sin embargo, vea la advertencia 2: la página menciona querer evitar los “efectos de agotamiento”, por lo que las ventajas de una prueba corta podrían haberse demostrado empíricamente que superan los inconvenientes. Sin embargo, no tenemos esta información).

Una puntuación de 33 le daría un coeficiente intelectual de aproximadamente 180 (Sigma V).

Sin embargo, parece justo que aproximadamente el 0.003% pueda resolver 28 o 29 problemas.
Tal vez sería correcto asignar un coeficiente intelectual de 125-130 a alguien que pueda resolver 20 problemas, pero entonces sería necesario eliminar algunos de los problemas iniciales y agregar otros más difíciles.

Esto entra en concordancia de puntaje, o comparación de puntajes entre diferentes pruebas. Si bien es posible que las comparaciones entre los puntajes en esta prueba y en las pruebas de IQ sean meramente ilustrativas, decir que “20/35 correcto corresponde a un IQ de 130” es en gran medida sin sentido. Las pruebas de inteligencia simplemente no están diseñadas para discriminar a un nivel tan alto. Por lo tanto, es incorrecto decir “33/35 == IQ de 180.”


A continuación, los pensamientos sobre la prueba en sí:

¿Qué mide esta prueba? Una buena prueba de la capacidad mental general debe medir exactamente eso: la capacidad mental general. Por otro lado, esta prueba parece medir … algo que no es exactamente eso. Un problema es que hay un gran componente de conocimiento en estas preguntas. La pregunta 11 es un buen ejemplo: con solo mirar la pregunta, puedo decir que la respuesta es 11 multiplicada por la suma de la secuencia [1, 2, 3 … 1000]. Las personas con suficiente entrenamiento matemático que conocen el atajo de fórmula pueden hacerlo fácilmente: la respuesta es 11 * (1000 * 1001/2). Pero entonces esta pregunta no es una buena medida de la habilidad mental GENERAL.

En particular, una vez que pasamos el Nivel VI, los elementos comienzan a parecerse al tipo de preguntas presentadas en competencias matemáticas como la OMI, etc., escritas como problemas de palabras. Hay algunas matemáticas complicadas aquí. Esencialmente, la suposición que se está haciendo es que el mejor diferenciador de inteligencia en percentiles altos es la capacidad matemática. ¿Cuál es la justificación de esto? ¿Esto ha sido demostrado teóricamente?

Mirando el análisis factorial proporcionado en el sitio web, las preguntas después de 16 o más parecen corresponder a un factor separado. Solo leyendo las preguntas, no me sorprendería si este factor fuera algo así como “habilidad matemática avanzada” en lugar de “habilidad mental general”.

Ahora, es totalmente plausible que los genios puedan responder estas preguntas de manera intuitiva sin una capacitación matemática formal. Ahí no está el problema. El problema es que si un estudiante de licenciatura en matemáticas puede responder fácilmente, por ejemplo, 30/35 de las preguntas, entonces esta prueba no es necesariamente una buena medida de la capacidad mental general. En términos de teoría de pruebas, esta prueba es multidimensional y compensatoria: una capacitación matemática suficiente puede (teóricamente) compensar la falta de capacidad mental y dar como resultado una puntuación muy alta.

Puntuación de los elementos cualitativos : muchos de los elementos (especialmente en los niveles más altos) son cualitativos. ¿Cómo se califican estos elementos? ¿Qué tan estadísticamente válido es el método de puntuación? Esta información ayudaría enormemente a determinar la calidad de esta prueba.

De vuelta a la pregunta principal: la prueba como criterio de admisión : si el propósito de esta prueba es evaluar a los miembros para una sociedad de genios o lo que sea y NO ser una medida válida de inteligencia, el autor es libre de probar lo que sea que haga. agrada Él podría también tirar en cabello rubio / ojos azules como artículos de prueba. Esencialmente, esta es una prueba de la capacidad mental ya que el autor conceptualiza la capacidad mental.

tl; dr: Esta prueba está bien como criterio de admisión porque la sociedad Sigma es libre de evaluar cualquier criterio que desee y no tiene ninguna prerrogativa de ser justa y equilibrada. Sin embargo, esta prueba probablemente no sea muy buena para identificar genios por varias razones, las principales son problemas de validez y problemas de multidimensionalidad. La forma en que se presenta la prueba implica que está destinada a ser una prueba válida y superior para evaluar genios, y en ese sentido, no creo que esta sea una muy buena prueba.