Intentaré ayudarte como otro fanático del cine.
Esto puede ir de muy simple a muy complejo, ya que los proyectos como el tuyo comienzan con una idea simple y probablemente terminen como un sistema de recomendación, así que lo mantendré simple.
Puede predecir la clasificación de una película por un promedio ponderado de películas similares. Y las películas similares son aquellas que tienen una puntuación alta en una función de similitud que debes definir. Puede comparar la similitud de sus atributos: el mismo director, el número de actores en común, el escritor, el género, etc. Su objetivo es definir esta función de una manera efectiva y creativa. Normalice su puntuación para obtener un número de 0 a 1.
Luego tome la “k” de las películas más similares a la suya y calcule un promedio ponderado de sus calificaciones. El peso es la similitud y entre cada una de esas películas “k” y la que desea puntuar.
- Películas: ¿Se filma una película en un orden que coincide con su trama?
- ¿Por qué se critica críticamente la Puerta del Cielo?
- ¿Qué tan realista es el terremoto y el tsunami representado en la película de San Andrés? ¿Podrían los eventos de San Andrés realmente suceder?
- ¿Quién mató a las dos niñas en la película La milla verde?
- ¿Puede un compositor tomar una canción que escribieron para una película y usarla en otra película para la que están haciendo música?
Por ejemplo, digamos que queremos predecir la clasificación de “Mentiras verdaderas”, usamos k = 3 y encontramos que las películas más similares son:
misión imposible (0.65) calificación: 3.5
terminador 1 (0,42) calificación 4
terminador 2 (0.53) rating 4.5
Ahora podemos estimar la calificación de “Mentiras verdaderas” como:
(0.65 * 3.5 + 0.42 * 4 + 0.53 * 4.5) / (0.65 + 0.42 + 0.53) = 3.92
Se pueden sugerir millones de variaciones y algoritmos, pero si este es un proyecto nuevo para usted, sugiero comenzar con el enfoque de vecinos más cercanos, en otras palabras, las películas más similares a las que desea calificar.
Si está interesado en realizar más investigaciones, esto se conoce como “filtrado basado en contenido”, lo que significa que estamos buscando artículos similares en función del contenido del artículo. Este es un buen enfoque porque puede usar su creatividad para definir la similitud entre dos películas de la forma que desee. Una forma de pensar es asignar puntos por cosas diferentes y dividir el número total de puntos posibles para obtener una puntuación entre 0 y 1. Por ejemplo, si el director es el mismo, sumamos 3 puntos. Si tienen 3 o más actores en común 5 puntos, 2 actores en común 2 puntos, 1 actor en común 1 punto, el compositor de partituras es el mismo 1 punto, el mismo género 6 puntos, etc. etc. Es muy divertido sintonice esto y vea qué películas son similares a algunas muestras seleccionadas y haga eso para calibrar su función de similitud.
La buena noticia es que puede divertirse mucho y solo necesita los datos y unas habilidades de programación mínimas.
¡Que te diviertas!
Luis.