Yshopnoosa.com

Hur man bygger en beslut Tree databas

Hur man bygger en beslut Tree databas

Beslutsträd är föremål för intensiv akademiska studier inom operationsanalys och datavetenskap. Medan inte nödvändigtvis det bästa sättet att strukturera information behövs för att nå en slutsats, fungerar beslutsträd bra med standardinformation om datoralgoritmer för beslutsstöd. Dessutom ger de en metod för att uttrycka affärsregler på ett sätt som personer med ingen tidigare erfarenhet av beslutsträd är kan följa. Ett beslutsträd liknar en ett flödesschema, vilket gör att navigering genom en bana av val tills en slutgiltig slutsats nås.

Instruktioner

1 Få de datamängder som används för analys och kontroll av den slutliga trädet. Mer data används i analysen kommer att ge en mer exakt trädrepresentation av beslutsprocessen. Det finns många olika sätt att skapa och strukturera ett beslutsträd. ID3 algoritmen är en tidig strategi som har varit grund för mer avancerade varianter.

2 Lista över alla de attribut som används av datauppsättningen. Exempelvis i en uppsättning av bank lån programdata, kommer att rekordet för varje sökande innehålla attribut, till exempel namn, adress, telefon, inkomst, hem värde, inteckning, bank och kreditkort saldon.

Om du manuellt skapar ett beslutsträd, naturligtvis utesluter attribut såsom namn, som du inte förväntar att påverka beslutet att bevilja ett lån. När du använder datorn data mining tekniker, alla attribut är ansedda, lämnar datorprogrammet att avgöra vilka som har någon betydelse för det slutliga utfallet.

3 Ange vilket attribut är Målattributet. I exemplet med en låneansökan är Målattributet en som indikerar om lånet var beviljas eller nekas.

4 Markera attributet att ge den största information vinsten för användning som rotnoden. Trädet består av beslutspunkter och lövnoder. På beslutspunkter skapas en gren för varje möjligt värde för attributet target. Varje gren representerar dataposterna som har samma värde för attributet target.

En lövnod nås när alla poster som övervägs på den aktuella noden har samma resultat för Målattributet. I exemplet med lån om alla som ansöker om ett lån godkänns, gäller hela beslutsträdet triviala av en enda lövnod med inga grenar. Det är mer sannolikt att uppgifterna kommer att delas upp i två grenar: godkända och nekade.

Beräkningsmetoder att markera attributet du använder på alla trädnoden är ytterst komplexa. Leta efter attributet som starkast förutspår målet resultatet. Intuitivt, skulle "inkomst" vara en bättre kandidat för rotnoden än "förnamn."

5 Ta bort attributet roten från listan över potentiella attribut ska användas för grennoder. Välj attributet återstående med information största vinsten att tilldela grennoder.

I det aktuella exemplet skapa grennoder vid varje punkt i trädet grenar av godkända och nekade lån. Det kan vara valfritt antal grenar från en trädnod beslut, beroende på hur många möjliga värden kan tilldelas till Målattributet.

6 Upprepa processen längs varje gren tills du har nått en lövnod där alla data delar samma värde för attributet target. Det maximala djupet av trädet när som helst blir det totala antalet attribut identifieras i början.

Det är troligt att inte alla attribut är betydelse för beslutet i varje gren och så några grenar kommer att vara kortare. När du har slutfört trädet, gå igenom den för att hitta de regler som det har framställts. Till exempel kan vara att "ett lån kommer att godkännas om du har en hög inkomst, hög besparingar och inga skulder."

7 Använda test datauppsättningen för att validera trädet skapad. Trädet bör exakt förutsäga resultaten i den nya informationen.