Nel mondo di oggi, Regole di associazione è diventato un argomento di grande importanza e interesse per un ampio spettro della società. Con l'avanzamento della tecnologia e i cambiamenti del contesto sociale, Regole di associazione ha acquisito una rilevanza sempre maggiore, influenzando aspetti fondamentali della vita quotidiana. Sia come oggetto di studio, come protagonista di dibattiti pubblici o come motore di trasformazioni in vari ambiti, Regole di associazione esercita un'influenza significativa sul modo in cui le persone percepiscono il mondo e si relazionano tra loro. In questo articolo esploreremo ulteriormente l'impatto e l'importanza di Regole di associazione nella società contemporanea, analizzando le sue implicazioni e la sua portata in diversi aspetti della vita odierna.
Nel data mining, le regole di associazione sono uno dei metodi per estrarre relazioni nascoste tra i dati.
Agrawal et al.[1] introdussero le regole di associazione per la scoperta di regolarità all'interno delle transazioni registrate nelle vendite dei supermercati. Per esempio, la regola individuata nell'analisi degli scontrini di un supermercato indica che il se il cliente compra insieme cipolle e patate è probabile che acquisti anche della carne per hamburger. Tale informazione può essere utilizzata come base per le decisioni riguardanti le attività di marketing, come ad esempio le offerte promozionali o il posizionamento dei prodotti negli scaffali. Le regole di associazione sono anche usate in molte altre aree, quali il Web mining, la scoperta di anomalie e la bioinformatica.
Il concetto di regola di associazione divenne popolare a causa di un articolo del 1993 di Agrawal et al.[1]. Secondo Google Scholar esso possiede più di 9500 citazioni (Settembre 2010) ed è uno degli articoli più citati nel campo del data mining. Tuttavia è possibile che quella che viene chiamata come regola di associazione sia simile a un approccio di data mining presentato nel 1966[2] e sviluppato da Hájek et al.[3].
ID | latte | pane | burro | birra |
---|---|---|---|---|
1 | 1 | 1 | 0 | 0 |
2 | 0 | 0 | 1 | 0 |
3 | 0 | 0 | 0 | 1 |
4 | 1 | 1 | 1 | 0 |
5 | 0 | 1 | 0 | 0 |
Seguendo la definizione originale di Agrawal et al.[1] il problema della scoperta di regole di associazione è rappresentato come segue. Consideriamo l'insieme di attributi binari (oggetti o item) e l'insieme di transazioni (database). Ciascuna transazione appartenente a possiede un codice identificativo (ID) e contiene un sottoinsieme degli oggetti contenuti in . Una regola è definita come un'implicazione nella forma dove e . L'insieme di oggetti (o itemsets) e vengono chiamati rispettivamente antecedente e conseguente della regola.
Per illustrare questo concetto, è possibile usare un esempio giocattolo riguardante un supermercato. L'insieme di oggetti è e il database contenente gli oggetti è rappresentato nella tabella a destra, dove 1 indica la presenza di un oggetto in una transazione e 0 l'assenza. Un esempio di regola di associazione potrebbe essere: . Essa indica che se il cliente acquista pane e burro, comprerà anche il latte.
Attenzione: questo esempio è estremamente piccolo. In un'applicazione reale una regola necessita di un supporto di diverse centinaia di transazioni perché sia considerata statisticamente significativa e il database deve contenere migliaia (o milioni) di transazioni.