I 5 algoritmi di Machine Learning più utilizzati

Teoria

Prendendo spunto da un recente articolo, elenco in rassegna i 5 algoritmi più utilizzati nell’ambito del machine learning, secondo l’autore. È importante conoscere e “sporcarsi le mani” con questi algoritmi, poiché si presume che nel prossimo futuro, oltre il 25% degli attuali lavori sarà soppiantato da algoritmi di machine learning.

Eccoli, riassunti in pochissime parole. Per una trattazione più dettagliata, vi rimando all’articolo originale in lingua inglese.

Naïve Bayes Classifier Algorithm

Algoritmo di classificazione di contenuti testuali. Un filtro antispam, ad esempio, fa un uso di un classificatore che, al suo interno, può implementare questo algoritmo. Attraverso questo, sarà in grado di determinare se una email in ingresso sia o meno spam.

Questo algoritmo viene anche utilizzato per la Sentiment Analysis (es. dai tweet pubblicati, capire se siano “positivi” oppure “negativi”) o anche per la classificazione automatica dei documenti (es. Google News).

K-Means Clustering Algorithm

Questo è un algoritmo iterativo, che si occupa di suddividere una popolazione in k gruppi determinati a priori. Ad esempio, una ricerca effettuata su un motore come Google, può ritornare risultati affini alla parola chiave inserita, ma non necessariamente legati ad un unico argomento. In questo caso, quindi, è necessario suddividere i risultati in k gruppi diversi, in modo che tutti quelli che appartengono ad un gruppo siano correlati.

Support Vector Machine (SVM)

Algoritmo di apprendimento supervisionato utilizzato sia per problemi di classificazione che di regressione. L’algoritmo ha come risultato quello di dividere i dati di apprendimento in classi, in modo tale che la distanza tra queste sia la massima possibile.

Viene utilizzato per la previsione degli andamenti borsistici, ad esempio comparando l’andamento di un titolo rispetto all’andamento globale degli altri titoli nello stesso settore.

Apriori Machine Learning Algorithm

Questo algoritmo di apprendimento non supervisionato, genera delle regole di associazione a partire da un insieme di dati. Queste regole sono nella forma “se… allora” (if… then). Ad esempio, questo algoritmo potrebbe determinare che chi ha comprato un iPad, ha acquistato poi una cover.

Questo algoritmo, quindi, può essere utilizzato per suggerire a potenziali clienti altri prodotti da acquistare, sulla base degli acquisti effettuati da altri utenti precedentemente.

Regressione lineare

Già trattata in questo articolo, la regressione lineare permette di stimare il valore di una variabile dipendente da tante altre. Può essere utile per stimare le vendite, in funzione del periodo dell’anno.

 

Ovviamente gli algoritmi sono numerosi e con prestazioni e applicazioni molto diverse, ma vi ricordo che prima di tutto vengono i dati! Se non avete quelli e se non sapete come maneggiarli, non ci sarà algoritmo che vi potrà dare le risposte che cercate!

Iniziate, quindi, a raccogliere ciò che riuscite: i dati sono l’oro del futuro!

A presto!
Marco

Please follow and like us:
No Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

Teoria
Un po’ di gergo del Machine Learning

Proprio oggi mi sono imbattuto in un interessantissimo articolo su Linkedin Pulse che aveva come argomento il gergo che viene solitamente utilizzato nell’ambito del machine learning. Trovo necessario che, chiunque decida di avvicinarsi a questa branca interessantissima della matematica/informatica, debba necessariamente avere padronanza del linguaggio tecnico per poter comprendere a fondo …

Teoria
Reti neurali: cosa sono?

Abbiamo visto come alcuni problemi di machine learning non siano tanto volti a trovare come soluzione una funzione (es. stima del prezzo di una casa), ma ad associare una fra un insieme di classi. Questi problemi vengono genericamente detti problemi di classificazione. Supponiamo, ad esempio, di voler scrivere un software in grado di …

Teoria
Classificazione: come perdere il lavoro in 5 minuti usando la regressione lineare

Gli algoritmi di classificazione non hanno come obiettivo quello di individuare una funzione che ci permetta di stimare un valore continuo di una variabile dipendente da n altre variabili indipendenti, ma quello di stimare un valore di verità (vero / falso) o di appartenenza ad una determinata classe. Alcuni esempi di problemi …

Social media & sharing icons powered by UltimatelySocial