Cómo predecir si una película será buena o no usará datos

Intentaré ayudarte como otro fanático del cine.

Esto puede ir de muy simple a muy complejo, ya que los proyectos como el tuyo comienzan con una idea simple y probablemente terminen como un sistema de recomendación, así que lo mantendré simple.

Puede predecir la clasificación de una película por un promedio ponderado de películas similares. Y las películas similares son aquellas que tienen una puntuación alta en una función de similitud que debes definir. Puede comparar la similitud de sus atributos: el mismo director, el número de actores en común, el escritor, el género, etc. Su objetivo es definir esta función de una manera efectiva y creativa. Normalice su puntuación para obtener un número de 0 a 1.

Luego tome la “k” de las películas más similares a la suya y calcule un promedio ponderado de sus calificaciones. El peso es la similitud y entre cada una de esas películas “k” y la que desea puntuar.

Por ejemplo, digamos que queremos predecir la clasificación de “Mentiras verdaderas”, usamos k = 3 y encontramos que las películas más similares son:
misión imposible (0.65) calificación: 3.5
terminador 1 (0,42) calificación 4
terminador 2 (0.53) rating 4.5

Ahora podemos estimar la calificación de “Mentiras verdaderas” como:
(0.65 * 3.5 + 0.42 * 4 + 0.53 * 4.5) / (0.65 + 0.42 + 0.53) = 3.92


Se pueden sugerir millones de variaciones y algoritmos, pero si este es un proyecto nuevo para usted, sugiero comenzar con el enfoque de vecinos más cercanos, en otras palabras, las películas más similares a las que desea calificar.

Si está interesado en realizar más investigaciones, esto se conoce como “filtrado basado en contenido”, lo que significa que estamos buscando artículos similares en función del contenido del artículo. Este es un buen enfoque porque puede usar su creatividad para definir la similitud entre dos películas de la forma que desee. Una forma de pensar es asignar puntos por cosas diferentes y dividir el número total de puntos posibles para obtener una puntuación entre 0 y 1. Por ejemplo, si el director es el mismo, sumamos 3 puntos. Si tienen 3 o más actores en común 5 puntos, 2 actores en común 2 puntos, 1 actor en común 1 punto, el compositor de partituras es el mismo 1 punto, el mismo género 6 puntos, etc. etc. Es muy divertido sintonice esto y vea qué películas son similares a algunas muestras seleccionadas y haga eso para calibrar su función de similitud.

La buena noticia es que puede divertirse mucho y solo necesita los datos y unas habilidades de programación mínimas.

¡Que te diviertas!
Luis.

Comenzar con una serie de hipótesis. Hubo un enlace sobre las características de la película a la que no pude acceder, pero puede deconstruir fácilmente los principales factores que contribuyen a una película.
Actores / estrella
Pista de sonido
Director
Tema
Guión / autor
Musica / musicos
Etc.
Forme la hipótesis en torno a cada una de las categorías, evalúe cada factor y luego construya sus algoritmos

1. Por lo general, empezaré por ver de qué trata la película. Si se basa en una novela popular ampliamente moderna, por ejemplo, Juegos del Hambre, 50 Shades of Grey, Twilight series, Da Vinci Code, lo evitaré como la plaga.

2. Hay algunos directores que también evito, porque he salido de sus películas en un momento u otro.

i) Edward Zwick
ii) Michael Bay
iii) Baz Luhrman

y algunos actores, por ejemplo, Keanu Reeves, no solo porque es un actor tan malo, sino también porque le gustan mucho las películas que son tan populares que considero una basura como la serie The Matrix.

3. Y, finalmente, leeré críticas de críticos establecidos cuyos gustos de películas coinciden en gran medida con los míos.

Primero, necesitas definir cuáles son las características que tiene una buena película. Echa un vistazo a http://www.yellowfinbi.com/YFCom