Több, jobb, gyorsabb:
a Statistica 12 újdonságai
 

A Big Data jelenség, az adatok nagyságrendi növekedése, a digitális tárolási kapacitás és a feldolgozó technológiák fejlődése együtt robbanásszerűen, örökre átalakította az üzleti analitika tájképét. Az elemző eszközök használata és a döntéshozatal már nem csak az adattudósok, programozók, képzett szakértők privilégiuma. Használatuk ma már számos munkaterületen a napi feladatok részévé vált, alkalmazzák menedzserek, üzleti elemzők, prediktív modellezést végzők, vevőszolgálati ügynökök és ügyvezetők, akik jól érthető információk alapján megfelelő döntéseket akarnak hozni. Ezek a felhasználók olyan vizuális felületet igényelnek, amelyen létrehozhatók, megtekinthetők, megoszthatók a KPI (kulcsteljesítmény) mutatók, jelentések, prezentációk, grafikonok – hogy csak néhány példát említsünk.

A változó igények tökéletes kielégítése végett az új STATISTICÁt úgy alkottuk meg, hogy gyorsabb, rugalmasabb, és hasznosabb legyen, mint valaha:

  • A termékcsalád összes tagjánál fokoztuk a Big Data kezelés hatékonyságát.

  • Megalkottuk az új AdvancedQueryBuildert, amellyel vizuális felületen keresztül hozhatóak létre SQL lekérdezések bármely termékünkben.

  • A még hatékonyabb, intuitív felhasználás érdekében teljesen átalakítottuk a Statistica Enterprise és Data Miner vizuális elemző munkakörnyezetét, a munkafolyamat jobb vizualizációja és a nagyobb tárolási kapacitás segítségével könnyebben megérthetők és kommunikálhatók az eredmények.

  • Erősítettünk a Decisioning Platfrom® prediktív/preszkriptív képességein.

  • Bevezettük a rendkívül rugalmas Reporting Tables terméket, amely segítségével a felhasználók vizuálisan hozhatnak létre összefoglaló statisztikákat tartalmazó táblázatokat prezentációkhoz, jelentésekhez.

  • Új node-okat fejlesztettünk ki, mint például a praktikus Data Health Check, amely nagy mennyiségű változó megtisztítására szolgál.

A StatSoft – a felhasználói elvárások messzemenő kielégítésében majdnem 30 éves hagyományaira építve – 2013 áprilisában a Statistica 12 kiadásával olyan új, fontos funkciókkal bővített, megnövelt teljesítményű termékcsaláddal jelent meg ebben az örökké változó iparágban, mely az analitikai megoldások használatát még elérhetőbbé, gyorsabbá és hatékonyabbá teszi mind üzleti vezetők, mind pedig tapasztalt felhasználók számára.

Jobban beilleszkedünk az Önök IT infrastruktúrájába, mint bármely alternatíva. Legyen szó közepes adathalmazok, vagy Big Data kezeléséről, a Statistica 12 minden eddiginél jobban kihasználja az adattárházakat és IT eszközöket, hozzásegítve a vállalatot a befektetések gyors és nagy arányú megtérüléséhez.

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Minden terméket érintő fejlesztések


Advanced Query Builder

Az Advanced Query Builder (AQB) használójának a komplexebb adat lekérdezések beállításánál sem kell szakértő segítségét kérnie. Az új kezelőfelületen egyszerű műveletekkel (drag&drop, beágyazás, kiválasztás) felépíthető a lekérdezés. Az alkalmazás elemzője a kontextus alapján alkotja meg a végleges kódot.

Funkcionalitásában az AQB specializált szoftverekkel vetekszik, képes LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN műveleteket grafikus bevitel alapján létrehozni, szintén kezeli az aggregátor függvényeket, illetve komplex, UNION és MINUS operátorokat tartalmazó lekérdezések is felépíthetőek vele. Vizuálisan meg tud jeleníteni komplex SQL lekérdezéseket, illetve ER diagramokat, és lehetőséget nyújt az SQL dialektus megváltoztatására, ha az univerzális alapértelmezés nem megfelelő.


Újdonságok a táblázatkezelésben


Új fájlformátum a Big Data jobb támogatására

A Statistica 12 új adatfájl formátumot vezet be, amely az extrém méretű, Big Data állományok optimális kezelése érdekében támogatja a változó hosszúságú szöveges változókat. Az új formátumban a szöveges változók szórványosan kitöltött oszlopai automatikusan optimalizálásra kerülnek, ezzel csökkentve az adattábla méretét, amely jelentős teljesítménynövekedéshez vezet.


„Virtutális változók” a táblázatokban

A táblázatkezelő mostantól virtuális változók használatára is képes. Ezek értékeit egy formula határozza meg, csak futási időben kerülnek kiszámításra, így nem igényelnek valódi tárolási kapacitást. A virtuális változók kezelése a háttérben történik, létesítésük, törlésük során nincs szükség a táblázat jelentős részének átírása, így a felhasználó csak a teljesítménynövekedést tapasztalja. Az új adatok külön vektorban tárolódnak a merevlemezen, és a többi adattal csak mentéskor kerülnek összefésülésre. Ennek teljesítménynövelő hatása különösen jól érzékelhető, amikor transzformált változókkal kell bővíteni nagy méretű táblázatokat.


Text Label: több szöveges címke

A Statistica táblázatokban a numerikus változóknál alkalmazott Text Label tábla már akár egymillió egyedi címkét (kód-szöveg megfeleltetést) is tartalmazhat, és számottevően gyorsult a név/érték kikeresés is. Ezeknek köszönhetően a Text Labelek használatával már a nagyon sok különböző szöveget tartalmazó változók esetén is jobb teljesítmény érhető el a fix méretű, numerikus tárolás és az ismétlődő értékek többszörös tárolásának kiküszöbölése révén.


Aggregátor függvények a Statistica OLE DB szolgáltatójában

A Statistica adattáblák OLE DB elérése most már lehetővé teszi az olyan aggregátor függvények használatát is, mint az avg, count, min, max vagy sum.


Fix oszlopszélességű szövegfájlok importálása

A Statistica ezen fejlesztése lehetővé teszi a fix karakterszámú oszlopokat tartalmazó szövegfájlok feldolgozását, az egyes változók beolvasásához az oszlopméretek megadását.

A Statistica az importálásnál felajánlja a „Fixed” beállítást.


Adat vizualizáció

Számos új eszköz és funkció segíti az adatok vizualizációját.

  • A 2D pontdiagramok már az "orthogonális regresszió" típusú illesztést is támogatják.

  • Megjegyzés fűzhető a grafikonok egyes pontjaihoz.

  • Az összetett grafikonokon a méretezés pontos beállítására szolgáló új opciókkal javítható a vizuális megjelenítés.

  • A „Brushing” funkció segítségével a kiválasztott pontok új adatfájlba menthetők.

  • A program segít a grafikonok dátum és idő szerinti skálázásában.

  • Az összetett grafikonokon minden adatsor határai módosíthatók.

  • Könnyebb a Pareto-diagram készítése.

  • Új grafikon típus: a párhuzamos koordináta diagram (parallel coordinate plot) több változót mutat egymás mellett összemérhető beosztással, így könnyebb az egyes esetek összehasonlítása több változónál is.

Minden Y tengely egy Statistica táblázatban lévő változónak felel meg, az ábrázolás módjaként választhatók egyedi értékek vagy kétoldali értékek (pl. tartományhatárok, felső és alsó határ, stb.).


Statisztikai funkciók


Új eljárások

False Discovery Rate (FDR) és Qvalues. Az FDR a Benjamini és Hochberg módszerét, a Qvalues pedig az itt elérhető cikkben leírt eljárást alkalmazza.


Új eloszlások

A hipergeometrikus (inverz, kumulatív, valószínűségi), az inverz Poisson eloszlás és az inverz binomiális eloszlás elérhetők a Probability Distribution Calculator-ban, a Statistica Visual Basic függvényei között, és a táblázatkezelő függvényei között is.


Stepwise Model Builder
(Statistica Advanced)

 A Stepwise Model Bulder lehetővé teszi a modellépítés irányítását és egy „mi lenne ha…” környezetet is biztosít a modellező számára. Ez hasznos, ha az előírások vagy a vállalat működési szabályzata korlátozza a modellezéshez használt változók körét. Például egy bank nem különböztetheti meg az ügyfeleit koruk vagy nemük szerint.


Negatív binomiális eloszlás
(Statistica Advanced)

A GLZ modulban a válasz változó eloszlásaként negatív binomiális is választható. Ez a kevert Poisson - Gamma néven is ismert eloszlás a folyamatos gamma eloszlás diszkrét megfelelője.


Minőségellenőrző kártyák
(Statistica Quality Control)

A minőségellenőrző kártyákon a program lehetőséget ad a beavatkozási és figyelmeztető határok áltat meghatározott zónák („in control”, „out of control” és „out of warning lines”) megfelelő háttérszínének beállítására.


További újítások


Microsoft Office 10 stílusú eszköztárak

Az új Statistica Microsoft Office 2010 stílusú eszköztárakat használ. A Help menü a File fül alá került.


Könnyebb keresés

Mostantól az egyes modulok név szerint kereshetőek. A szalagmenü összes eleme ábécé sorrendben jelenik meg. A keresődobozba való gépeléskor a mutatott lista a keresett kifejezés szerint szűkül. Entert nyomva a kiválasztott modul párbeszédablaka nyílik meg.


Nagy felbontás, DPI 120 támogatás

A Microsoft Vista megjelenése, és a nagyfelbontású monitorok széleskörű elérhetősége óta a Microsoft jelentősen egyszerűbbé tette a DPI beállítások megváltoztatását, a Windows 7 alapértelmezett témái pedig mind DPI 120-asok nagy felbontáson. Ezt a beállítást most már a Statistica is támogatja.

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Statistica Data Miner fejlesztések


Megújult munkafelület

A Statistica Data Miner munkafelülete (Workspace) számos új funkcióval bővült a használhatóság és a teljesítmény növelése érdekében, különös tekintettel a nagy adathalmazok kezelésére.

Új node-ok sora jelent meg, melyek új konfigurálási felülete hasonlít a megfelelő interaktív modul dialógusához. A korábbi node-ok továbbra is elérhetőek és kompatibilisek a jelen verzióval.


Hatékonyabb importálás Excel fájlokból

Az Excel fájlok importálása során a Statistica lehetővé teszi a sorok és oszlopok kijelölésére az Excelben megszokott számok – betűk használatát.

Ez a jelölési mód az interaktív dialógusban és a Data Miner munkafelületen, az Import Excel node-nál is használható.

Ezzel a node-dal közvetlenül a Data Miner munkafelületére importálhatók az Excel fájlok.


Analitikai fejlesztések


Data Health Check

A Data Health Check node új eszköz a Statistica 12-ben, és minden Statistica Data Miner felhasználó számára elérhető. Ez a node minden változónál vizsgálja a szokásos hibák előfordulását, alapszintű tisztítást hajt végre rajtuk, és egy jelentést ad, amely alapján meghatározható, hogy milyen további adat tisztítás szükséges. A Data Health Check különösen nagy segítség nagy számú változó automatikus feltérképezésében.


Fák építése, érzékenység vizsgálat

Az új „érzékenység” opció segítségével többet tudhatunk meg a fa egy adott csomópontjáról. A kapott információ alapján a hozzáértő felhasználók módosíthatják a csomópontok ajánlott vágási értékeit.


Rendezett Twoing kritérium

Ez az opció lehetővé teszi a kategorikus függő változók sorrendi kezelését. Akkor hasznos, ha a kategóriák szinteket képviselnek (pl. alacsony, közepes, magas).


Prediktor szűrés

A prediktor változók elemzésére szolgáló új módszerrel egészült ki a Feature Selection eljárás. Ez az eszköz néhány alapvető statisztikával gyors áttekintő képet ad a prediktorról.


Adathozzáférés fejlesztések


Kód futtatása Teradata adatbázison
(Statistica Data Miner with Code Generator )

A felhasználó által definiált függvények most már Teradata adatbázisokhoz is készülhetnek, ami lehetővé teszi az adatbázison belüli osztályozást (in-database scoring).

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Statistica Enterprise fejlesztések


Új dinamikus elemek a riport templátokban

Újdonság a táblázat cellák használata dinamikus címkékben. Ezzel elérhető, hogy egy kijelölt cella tartalma megjelenjen a riport szövegében. A funkció mind numerikus mind pedig szöveges (akár teljes bekezdéseket tartalmazó) értékekre használható.

A Statistica munkafüzetek egyes elemei is megadhatók dinamikus címkeként, így ezek is beilleszthetők a riportba.

Továbbá, mostantól a Statistica kulcsszavak kibővített listája több fontos információ (többek között a munkafolyamat (workflow) neve, az SDMS verziószám) riportba illesztését teszi lehetővé.


Minőségellenőrző kártyák

A Statistica Enterprise immár lehetőséget nyújt a minőségellenőrző kártyákon a zónák színének, mintájának beállítására ugyanúgy, ahogy az a Statistica interaktív használatakor lehetséges. Ezen beállítások az Enterprise Manager alkalmazásból érhetőek el.


Adathozzáférés fejlesztések


SVB adatkonfigurációk

Az SVB adatkonfigurációk segítségével olyan, nem hagyományos adatbázisokat érhetünk el, amelyek nem rendelkeznek ODBC vagy OLE DB szolgáltatóval. Például egy nagy méretű szöveges állományra lehet adatbázisként tekinteni, azonban szöveges fájlként nem rendelkezik ODBCvel, vagy OLE DB szolgáltatóval. Egy SVB adatkonfiguráció segítségével azonban a Statistica képes adatbázisként használni. Amennyiben különböző lekérdezéseket akarunk végrehajtani előre meghatározott feltételek alapján, ezek szintén beprogramozhatóak az SVB adatkonfigurációba.


Általános dokumentumtárolás

Mostantól bármilyen fájl tárolható és elérhető az Enterprise System View struktúrájában, így Statistica dokumentumok és más fájltípusok az Enterprise Manager-ben tárolva megoszthatóak más felhasználókkal. A jelentések alapértelmezett mentési helye az Enterprise struktúra lett. A tárolt dokumentumokra is érvényesülnek a szabványos Statistica Enterprise hozzáférési beállítások és az SDMS verziókezelés.

Ezzel a módszerrel SVB és SVX kód is tárolható az Enterprise adatstruktúrában. Mostantól az Enterprise összes SVB programokat alkalmazó része képes az itt tárolt kódra hivatkozni, így ezen az egy helyen megváltoztatva azt, a módosítások egyidejűleg érvényre jutnak valamennyi hivatkozó SVB analízis konfigurációban, SVB adat konfigurációban, Data Miner node kódban, és a másodlagos SVB programokban az Enterprise-on belül.


Böngészők támogatása
(Statistica Enterprise Server)

A program minden népszerű böngészőt támogat: Internet Explorer, Chrome, Firefox, Safari és Opera. Így könnyen használható a Statistica Enterprise Server laptopról, vagy akár iPadről.


Munkafüzetek megosztása
(Statistica Enterprise Server)

Mostantól könnyedén megoszthatók a Statistica munkafüzetek a STATISTICA Enterprise Server Portal-on keresztül. Megosztás után egy Download from Server linket (URLt) kap a felhasználó, amelyen keresztül letölthető a fájl.


Verziókezelés támogatása (Statistica Enterprise Compliance Edition)

A Statistica Enterprise Compliance Edition a Statistica Enterprise ötvözése egy rendkívül jól skálázható dokumentumkezelő rendszerrel, amely segítségével bármilyen dokumentum biztonságosan felügyelhető. A rendszert úgy tervezték, hogy biztosítsa a megfelelőséget a FDA 21 CFR 11. szabályozásoknak, a Sarbanes-Oxley törvénynek és az ISO 9000, 9001 és 14001 dokumentációs követelményeknek. Az új funkciók segítségével könnyű a dokumentumok különböző verzióinak összehasonlítása, és a korábbi verziók megnyitása.


Verziók összehasonlítása

Mostantól, ha az SDMS integráció engedélyezett, az egyes SDMS objektumok különböző verziói összehasonlíthatóak az Enterprise Manager-ben. Minden követett Enterprise objektum rendelkezik szöveges reprezentációval:

  • Adat konfigurációk – a lekérdezések, adattípusok és az OLE DB oszlop tulajdonságainak listája

  • IQC analízis konfiguráció – a minőségszabályozási beállítások és paraméterek összefoglalója

  • SVB analízis konfiguráció – SVB kód és tulajdonságok

  • Rules object – a szabályok szöveges megjelenítése

  • PMML object – a modell PMML reprezentációja

  • Workflow – minden node-ot és paramétert részletező szöveg


Korábbi verzió megnyitása

Az Enterprise-ból közvetlenül megnyitható, verziókezeléssel követett objektumok, mint például a Data Miner munkaterületek (Workspace), a PMML és Rule objektumok tetszőleges korábbi állapotukban is megnyithatóak írásvédett nézetben.


Címkék (Statistica Web Data Entry)

A címkéket a Data Entry termék használja. Mostantól ezek tárolása történhet egy, vagy több rendszermappában, így a címkék könnyebben kezelhetőek.

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Statistica Scorecard fejlesztések


Calibration Tests

A Calibration Test eszköz segítségével összehasonlítható az hiteltörlesztés megszakadásának előre jelzett esélye (PD) a tapasztalt gyakorisággal.
A pénzügyi intézeteknél szokásos gyakorlat, hogy ügyfeleiket szegmentálják, csoportokba sorolják, és azzal számolnak, hogy minden csoportban vannak, akik képesek, és vannak akik nem képesek teljesíteni törlesztési kötelezettségüket. A pénzintézet által használt modell minden csoporthoz becsült PD értéket állapít meg. Idővel a használt modell pontosságát ellenőrizni kell. Az ilyen tesztek elvégzése rendkívül könnyű a Statistica segítségével. A program a „traffic light” módszert is alkalmazza, melyet az Oesterreichishe Nationalbank sokat idézett, hitelkockázat kezelésről szóló 2004-es útmutatójában írnak le.


Szabályok

A Statistica Scorecard már a Statistica Decisioning Platform-ba is integrálva van. Ezzel az eszközzel mostantól előállíthatók az ügyfél minősítési eljáráshoz (batch vagy live scoring) szükséges szabálysorok.

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Statistica Decisioning Platform fejlesztések


Weight of Evidence

Ez az új termék a bináris (igen/nem) predikcióval foglalkozóknak nyújt hasznos segítséget. Automatikusan végzi el a prediktor változók időigényes előfeldolgozását (csoportosítás, binning).

Két féle megoldást használ:

  • Optimális

  • Interpretált (a predikció valószínűségének megfigyelt kockázata)


Rules Builder

Minden szervezet rendelkezik szabályzattal, amely működését irányítja. Az analitikai projektek megvalósítása során az irányelvek következetes beépítése általában nehéz feladat. Ennek megoldásához nyújt segítséget a Rules Builder.

Ezzel az eszközzel az üzleti felhasználók, fejlesztők és modellezők is könnyen tudnak szabálykészleteket létrehozni, karbantartani, megosztani és újrahasznosítani. Például egy adat átalakításhoz létrehozott szabálykészlet egy, vagy akár ezer analitikai projektben is hasznosítható. A szabályokhoz való hozzáférés szabályozása szerepkör alapú.

A Rules Builder lehetővé teszi a scoring modellek feltételes alkalmazását előszegmentálás alapján, majd a scoring utáni eljárási szabályok alkalmazását. Az egyes szabályok magyarázó kódokat is adhatnak az egyes predikciókhoz, ami kritikus funkció számos iparágban, mint a bankipar, vagy a biztosító ipar. Például egy banknak kötelező informálnia az ügyfelét arról, hogy miért utasította vissza a hitelkérelmét. Az egyes szabályok végrehajtása vizuálisan végigkövethető példa adatokon a komplex rendszerek hibakeresését megkönnyítendő.

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Új termék


Statistica Reporting Tables

A cégeknek több új kihívással kell szembenézniük:

  • Nagy mennyiségű adatból könnyen átlátható összesítés készítése

  • Egyes adatszegmensek egyszerű kiemelése (pl. csak Franciaország és Oklahoma adatairól van szükség jelentésre)

 

A Statistica Reporting Tables automatikusan elrendezi és összefoglalja az adatokat a táblázat létrehozásakor megadott specifikáció szerint. A táblázatok létrehozása interaktív vizuális felületen keresztül történik, a felhasználó a Reporting Tables párbeszédablak négy zónájába húzhatja a különféle változókat (Layers, Column Label, Row Label és Sigma). A személyre szabás során a táblázat előnézete megtekinthető, és a végeredmény generálásához csak egy kattintásra van szükség.

A beállítható opciók módot adnak többek között a válasz kategóriák, a kereszttáblás csoportok kezelésére és a feltételes formázásra is (Multiple Response Categories, Crosstable Groups, Conditional Formatting)

Több, jobb, gyorsabbMinden termékData MinerEnterprise
Scorecard Decisioning PlatformÚj termék

Vissza a lap elejére

© Copyright 2022 StatSoft Hungary