¿Por qué los humanos necesitan solo el primer y el último carácter de la palabra para entender lo que se lee, mientras que las máquinas necesitan cada carácter?

Creo que esto se debe a razones técnicas y sociales en parte.

Técnico : los humanos tienden a generalizar sobre la base de su experiencia pasada, por lo que a veces podremos reconocer palabras frecuentes incluso si la única información disponible era el primer y el último carácter, porque podemos completar los espacios en blanco en función del información almacenada en nuestra memoria.
¿Pero también significa que adivinamos la palabra correcta?
Digamos que se suponía que debía adivinar una palabra con el primer carácter ‘ t ‘ y el último carácter ‘ s ‘; probablemente se te ocurra esto , por lo tanto , camiones , etc. ¿cómo sabrás cuál de estas palabras es la respuesta correcta?
Bueno, para responder que tendrá que evaluar el contexto en el que se supone que se debe usar esta palabra en particular;
Si la oración era ” T_____s es una escuela “, probablemente irás con Esto , pero si la oración fue ” Tengo dos t_____s “, una sustitución adecuada será camiones .

Para resumir, los humanos pasamos del siguiente procedimiento al resolver este problema:

  1. Recordemos de memoria, ¿cuáles son algunas palabras que siguen esta estructura?
  2. Si solo le viene a la mente una palabra, vaya al paso 4
  3. De estas palabras recordadas, ¿cuál es la más frecuente? (Será probablemente el primero que se me ocurra). Vamos a elegir este.
  4. Si esta palabra se ajusta al contexto, ya está. Si no, regrese al paso 1 para descubrir más palabras de este tipo.

Ahora, ¿cómo haría una computadora para resolver el mismo problema?

  1. Revise los datos disponibles, hasta que no haya más datos, combine el primer y el último carácter con la entrada
  2. Si solo una palabra coincidía con los criterios, eureka, usted ha resuelto el problema en la antigua y simple máquina binaria de Turing

    ¿Qué pasa si hay varias palabras?

  3. Bueno, ahora estamos en un aprieto, lo que tenemos es un problema no determinista, la computadora probablemente podría elegir su favorito (el que está en el índice cero de la matriz de resultados, o el que tiene una longitud mínima, etc.)

    Pero eso es aleatorio, ¿no? Odiamos al azar

  4. Traigamos algunas heurísticas a la obra, quizás haga que nuestro programa inspeccione un número considerable de documentos de texto y cuente la cantidad de tiempo que existe cada palabra.
  5. Ahora vuelva a visitar nuestra matriz de resultados y elija la que tenga la mayor puntuación (la más frecuente)

    No podemos tapar esta palabra a ciegas, ¿verdad? Tenemos que evaluar el contexto del problema, y ​​esta es la razón principal detrás de la incompetencia de una computadora. ¿Cómo averiguar el contexto de uso? La gente que procesa el lenguaje natural y el aprendizaje automático se está esforzando por encontrar una solución única para este problema, que para ser honesto no es un problema trivial, dada la complejidad y la ambigüedad de los lenguajes naturales. Aún así, no es imposible y los científicos han presentado soluciones parciales a tales problemas y también han tenido un éxito decente. Sin embargo, todavía se debe lograr una precisión del 100%.

Entonces, para responder a su pregunta: no es imposible construir un sistema así, pero ¿deberíamos hacerlo? Eso me lleva al aspecto social del problema:

Imagine que se postula para presidente y se supone que debe dirigirse al público en un debate cara a cara con su oponente. Desafortunadamente, a mitad de la discusión, tu oponente te avergüenza mucho, y el público comienza a abuchearte, estás casi sin argumentos, miras con angustia a tu gerente de campaña. Siendo la mujer proactiva, es decir, su gerente de campaña le pasa una tarjeta de notas con una nueva estrategia, para que pueda reconstruir su caso. Ahora, ¿correría el riesgo de pasar por alto el texto de la tarjeta de notas en la misma forma del “primer y último carácter”, y corre el riesgo de decir algo inapropiado? Estoy seguro de que no lo harás.

Digamos, en algún lugar de la nota, había una línea que prometía calzado de alta calidad para el Cuerpo de Marines (soldados): ” Necesitamos botas de alta calidad “, puedes imaginar cómo un skimmer puede interpretar b___s como b ** bs .

Leer mal una palabra en voz baja mientras lee una revista no tiene ningún efecto grave, pero hacerlo públicamente puede generar resultados no deseados.

Del mismo modo, confiamos en las computadoras para realizar trabajos mecánicos, pero lo hacemos con alta precisión, en el mundo de hoy, donde las computadoras son más ubicuas que nunca, confiamos mucho en ellas y, como candidato a la presidencia, no quisiera que mi iPad predecir la palabra falsa, solo porque mi gerente de campaña usó la técnica de entrada de “primer y último carácter” para ahorrar tiempo. No confiaré en tal sistema en una situación crítica a menos que se prometiera una precisión del 100%.

Porque las máquinas todavía tienen limitaciones en este momento.

Los humanos son seres holísticos, mientras que las máquinas son un producto de la mente cuya naturaleza es dividir y analizar. De ahí el análisis carácter por carácter.