A Statistica 9 újdonságai


Rövid áttekintés

 

Tovább növelt teljesítmény

A Statistica 9 sok új, egyedülálló tulajdonságot kínál, az egész Statistica  termékcsalád számos új funkcióval bővült. A rendszer sok alapvető részletét tökéletesítették, ami számottevően megnövelte a Statistica teljesítményét. E fejlesztések érintették a Statistica 32 bites változatát és az új, natív 64 bites Statistica változatot is.

32 bites változat. Az új technológiákkal, a program fő komponenseinek, aritmetikai magjának optimalizálásával a Statistica 9  32 bites változata is észrevehetően gyorsabban végzi el a  műveletek többségét, mint a Statistica 8 (amely már önmagában is az elérhető leggyorsabb statisztikai elemzőprogramok egyike). Például:

  • A kategorizált statisztikai rutinvizsgálatok (leíró statisztikák számítása az adatok több száz vagy több ezer kategóriára osztásával) kétszer gyorsabban elvégezhetők, mint korábban. Egyes esetekben, a különösen hosszú szöveges változókat tartalmazó adatállományokon a gyorsulás mértéke több százszoros is lehet.

  • A döntési fák számítása (C&RT) több mint kétszer gyorsabb.

  • A Neural Networks modul közel háromszor gyorsabb is lehet, a neuronhálózat szerkezetétől függően.

Az elemzőeszközök fejlesztése mellett a táblázatkezelés teljesítménye is tovább javult, így a  nagy adatfájlok feldolgozása most kevesebb erőforrást igényel.


64 bites változat. A Statistica 9 64 bites változata kihasználja a 64 bites operációs rendszer minden előnyét, ami jobb memóriakezelést és teljesítménynövekedést eredményez.  A 64 bites változat még nagyobb adattömeg feldolgozására, még nagyobb teljesítményre képes: bizonyos számításigényes elemzéseknél több mint kétszer gyorsabb a 32 bites változatnál. A Statistica 9 64 bites változata különösen jól használható az adatbányászatban és más ismeret-feltáró feladatok elvégzésénél, amelyek extrém adatmennyiség ismétlődő, intenzív feldolgozását igénylik.

Vissza a lap elejére

Megújult kezelőfelület

Menüszalag. A Microsoft Office 2007 alkalmazásokból ismert intuitív menüszalagon még könnyebb eligazodni. A leggyakoribb funkciók azonnal áttekinthetők, a kapcsolódó funkciók könnyen megtalálhatók. A klasszikus menük és eszköztárak továbbra is elérhetők, a két stílus között bármikor válthatunk.

 

A menüszalagról a Quick Access sor Menus utasításával válthatunk
a klasszikus nézetre.

A klasszikus menüből a View menü Ribbon Bar utasításával válthatunk
a menüszalagra.

Opciók fa-struktúrában. A kezelőfelület fejlesztésének eredményeként áttekinthetőbb lett a grafikonok megjelenését, a táblázatok viselkedését, a Statistica általános működését szabályozó paraméterek kezelése.

Az összetett, többrétegű dialógusokban az új fa-struktúra révén könnyebb elérni és áttekinteni a keresett opciókat. A program általános tulajdonságait a Tools/Options dialógusban, a grafikonok beállításait pedig a Format/Graph Options dialógusban találjuk meg, akár a menüszalagot, akár a klasszikus menüt használjuk.

A kijelölt esetek kiemelése. A vizsgálni kívánt adatok kijelölésének hatékony módja az Enable Selection Conditions opció használata a Spreadsheet Case Selection Conditions dialógusban. Mostantól a kiválasztott esetek alapértelmezés szerint halványzöld háttérrel jelennek meg. Ez a vizuális megkülönböztetés azonnal láthatóvá teszi, mely esetekre terjednek ki a következő vizsgálatok.

Hosszú szöveges adatok kezelése. Az táblázatcellákban az oszlopszélességet meghaladó szövegek kezelésére most két lehetőség biztosított: Ha a következő cella vagy cellák üresek, a szöveg ott folytatódhat, vagy az új Wrap text opció használatával a cellán belül több sorba tördelve is megjelenhet.

Vissza a lap elejére

A grafikus megjelenítés újdonságai

Vizuális adatfeltárás. A Statistica egyik erőssége az adatok szemléletes grafikus megjelenítése. Ezen a téren is tovább fejlődött a program, az új vizualizációs eszközök az eloszlás azonosítását, változók összehasonlítását, színes korrelációs térkép készítését teszik lehetővé  a Basic Statistics modulban.

A Basic Statistics and Tables dialógusban a Descriptive statistics vizsgálatot kijelölve két új összetett grafikont rajzoltathatunk: Graphs 2 és Graphical comparative summary display.
A Graphs 2 egy változó esetén szemlélteti az adatok eloszlását.

A Graphical comparative summary display áttekinthető összehasonlítást ad akár hat változóról is. A hisztogram és a box plot skálája változónként azonos.

A Correlation matrices új színes térképén jól látszik, hogy a győzelmi esély a futballmérkőzéseken mennyire függ a hazai pályától, a pontszámoktól stb.

A Variability plot egy faktor változását szemlélteti több más faktoron belül, így vizuális csoportosításra, adatbányászatra használható. Most a Variability plot is választható egyedi felhasználói grafikon definiálásához.

A felhasználói grafikonok használatával időt lehet nyerni, mert a választott egyedi beállítások tárolhatók, és újabb adatsorok vizsgálatánál azonnal újra alkalmazhatók.

Kategorizált grafikonok.  A kategorizált grafikonok készítésénél a kategóriaszám felső határa eddig 255 volt, az új verzióban ez a határ 1000-re emelkedett, így például a többszörös dobozos ábrán már akár 1000 doboz is ábrázolható.

Makróban rögzíthető grafikon beállítások. A makró-rögzítés hatékony eszköz, lehetővé teszi a Statistica objektum-modell egyszerű használatát azoknak is, akik nem kívánják a Statistica Visual Basic programnyelvet részleteiben megismerni. Az általánosan használatos műveletek automatizálhatók illetve ellenőrizhetők a szabályzatok alkalmazására kötelezett munkahelyeken.

A makrók rögzítése programozott elérést biztosít a program szinte minden területéhez, gyakorlatilag minden funkció minden részletéhez. Még a legbonyolultabb elemzések és grafikus ábrázolások is rögzíthetők Statistica Visual Basic (SVB) makró programok alakjában. Ezek később ismételten végrehajthatók vagy módosíthatók, illetve más alkalmazásokban építőelemként felhasználhatók.

A rögzíthető műveletek köre most a grafikonok testre szabásával, a Graph Options egyedi beállításainak rögzítésével bővült. Példaként tekintsünk egy vonalas ábrát, amelyen a vonal színét és vastagságát meg akarjuk változtatni. A Graph Options dialógust megnyitva, annak Plot General lapján módosítjuk a görbe beállításait. A Graph Options dialógus alján a Record Macro opció bejelölése esetén az ábra módosításával egy időben elkészül a változtatást leíró makró is, amint az OK gombra kattintunk.

A grafikonok testreszabásának rögzítési lehetősége a mester makrók készítésénél is rendelkezésre áll: a mester makró rögzítés elindítását követően az elvégzett elemzések és az elkészült grafikonok módosításai is tárolódnak. A mester makrót új adatokon futtatva megismételhető az elemzés, a grafikon módosításokkal együtt.

Vissza a lap elejére

Új és továbbfejlesztett elemzőeszközök

Eloszlások és szimuláció. Örömmel jelenthetjük be a Distributions & Simulation béta verziójának megjelenését. Ez a modul lehetővé teszi nagyszámú folyamatos vagy kategorikus eloszlás illesztését a megadott változókhoz. A szokásos eloszlások (normális, fél-normális, log-normális, Weibull, stb.) mellett vizsgálhatók speciális és általános eloszlások is (Johnson, Gaussian Mixture, Generalized Pareto, Generalized Extreme Value), és a Statistica automatikusan értékeli az illeszkedés jóságát minden kijelölt eloszlásra és változóra.

Ezen túlmenően, további feldolgozásra tárolni lehet az eloszlások illeszkedését a kijelölt változók listájához, valamint e változók egymás közti kovarianciáját. Az így tárolt adatok alapján a Distributions & Simulation modul képes szimulált adatsorok előállítására, melyek a megfelelő eloszlások mellett a változók közötti kovarianciákat is hűen tükrözik. Röviden, a nagyszámú változón végezhető hatékony eloszlásillesztés mellett ez a modul általános, többváltozós eloszlások illesztését is lehetővé teszi, és az eloszlások alapján a legkorszerűbb módszerekkel (például Latin-hiperkocka) adat-szimulációt is végez. 

E módszereket sikerrel alkalmazzák többek között a korszerű kísérlettervezés, a megbízhatósági tervezés vagy a kockázatmodellezés területén is.

A StatSoft köszönettel fogad minden megjegyzést, észrevételt, mely segíthet e terméket még hatékonyabbá, használhatóbbá tenni. Kérjük, küldje üzenetét a beta@statsoft.com címre.

Alapstatisztikák. A Statistica számos új alapstatisztikával egészült ki. A várható értékek egyezésének vizsgálatára eltérő variancia mellett most használható a Welch F statisztika, mely a Breakdown & one-way ANOVA elemzés eredménydialógusának ANOVA & tests oldalán található.

A várható értékek különbsége konfidencia intervallumának becslése (konfidencia határokkal) megtalálható a T-Test for Independent Samples by Variables dialógus Options oldalán, valamint a T-Test for Dependent Samples dialógus Advanced oldalán is.

Általános optimalizáló. A Statistica Process Optimization részét alkotó General Optimization modul egyedi, nagy teljesítményű, nyílt felépítésű termék, mely szinte tetszőleges bonyolultságú, egyedi függvények optimalizálására képes szimplex, genetikus és grid-search módszerekkel. A most béta verzióban kibocsátott modul alkalmazható minden olyan területen, ahol a megadott kritériumoknak megfelelő eredmény eléréséhez meg kell keresni a folyamat paramétereinek optimális értékeit (például az ipari termelésben, üzleti folyamatokban, pénzügyi vagy kutatási kutatásban).

Az optimalizálandó függvényt Statistica Visual Basic (SVB) programmal vagy összefüggések felsorolásával lehet megadni. A modul tervezésénél különös figyelmet fordítottak arra, hogy a függvényben szereplő Statistica vagy más (például R) hivatkozások sokszor ismételt végrehajtása a lehető leggyorsabb legyen. Ennek köszönhető, hogy ezzel a modullal könnyen megfogalmazhatók és hatékonyan megoldhatók a több prediktív adatbányászati modellre épülő (például összetett költségbecslő) és a szimulációs feladatok is (mint a sztochasztikus optimalizálás vagy optimalizálás többváltozós folyamatképességre).

Nemlineáris becslés. A felhasználói regresszióknál (User-specified regression, least squares és custom loss function) a függvény megadásánál a változók listája bármikor megjeleníthető a Review vars gombbal. A megjelenítést követően szokásos lépés egy függvényváltozó kiválasztása és alkalmazása a függvényben. Eddig a változó nevét be kellett írni, most a megjelenített listán a megfelelő változó neve dupla kattintásra bekerül a függvénybe.

A felhasználói regresszió least squares pontját érinti egy másik változás is: Időnként előfordult, hogy az adattábla egyik változóneve megegyezett a program PRED vagy OBS függvénynevével. Ilyen esetekben a felhasználó csak a változónév megváltoztatása után folytathatta az elemzést. Mostantól a PRED és OBS változónév is használható ebben a vizsgálatban.

Főkomponens elemzés. A Results dialógus Descriptives oldalán a 2D scatterplots gombbal több változó kijelölése után egy kattintással elkészíthető az összes pontdiagram.

Vissza a lap elejére

A Data Minert érintő fejlesztések

Data Miner Recipes. A Statistica 9 a korábbi béta verzió után a Data Miner Recipes (DMR) végleges változatát tartalmazza. Ez a könnyen kezelhető, rugalmas adatbányászati útmutató eszköz a StatSoft minden Data Miner vásárlójának rendelkezésére áll. A Recipes használatával a kezdő adatbányászok gyorsabban megtisztíthatják és kiértékelhetik adataikat, a gyakorlottabb felhasználók pedig hatékonyabban dolgozhatnak a rutinfeladataik automatizálásához rendelkezésükre álló új eszközzel. A DMR az adatfeltáráshoz kiválasztja a megfelelő alapbeállításokat, melyek szükség esetén egyszerűen módosíthatók.

További Data Miner fejlesztések. A munkafelületre helyezett műveleti ikonok összekötéséhez új gyorsbillentyűk és egérműveletek is használhatók. Eddig egy kapcsolat megadásához külön rá kellett kattintani mindkét ikonra, most a kapcsolati végpont kijelöléséhez elég a nyíl hegyét ráejteni a második ikonra.

A fejlesztések hatásaként észlelhetően gyorsult a nagyméretű táblák kezelése, 1000 kategóriás grafikonok is készíthetők, a C&RT fák görgethetők a Statistica Data Miner munkaterületén, és a statisztikai elemzések gyorsabban készülnek el.

A MARSplines eredménytáblázatban a változók nevei eddig csak 8 karakteres, rövidített alakban jelenhettek meg, ugyanitt mostantól a független változók teljes neve látható.

A Statistica Process Optimization részeként mostantól elérhető a fentebb bemutatott General Optimization modul béta verziója. Ez a modul tetszőleges egyedi függvények optimalizálására képes szimplex, genetikus és grid-search módszerekkel. Az optimalizálandó függvényt Statistica Visual Basic (SVB) programmal vagy összefüggések felsorolásával lehet megadni. A modul tervezésénél különös figyelmet fordítottak arra, hogy a függvényben szereplő Statistica vagy más (például R) hivatkozások sokszor ismételt végrehajtása a lehető leggyorsabb legyen. Ennek köszönhető, hogy ezzel a modullal könnyen megfogalmazhatók és hatékonyan megoldhatók a több prediktív adatbányászati modellre épülő (például összetett költségbecslő) és a szimulációs feladatok is (mint a sztochasztikus optimalizálás vagy optimalizálás többváltozós folyamatképességre).

Vissza a lap elejére

További újdonságok

Statistica ETL (Extract, Transform, and Load).  Ez a termék a Statistica rendszer elemeit kombinálva és kiegészítve nagy hatékonysággal osztályozza, összegzi, rendezi és elemzi az adatbázisból kinyert adatokat. Az ID-Based Statistica ETL képes a különböző forrásokból származó adatok összerendezésére batch/sarzs azonosító és időszak, illetve egy vagy több azonosító adat alapján. Több adatforrás adatainak ilyen egyesítése gyakori feladat az előállító és feldolgozó iparágakban, például a gyógyszeriparban.

Például, a Statistica ETL a gyártási adatok előfeldolgozásával elhárítja az eltérő mintaelemszámokból eredő problémákat, amelyek a PLS/PCA modellre épülő minőségellenőrzésnél vagy a Statistica Enterprise valós idejű vizsgálatainál jelentkeznek. Egy másik tipikus alkalmazási terület az eltérő időközönként mért gyártási adatok egyeztetése, akár a gyakrabban rögzített adatok összesítésével, akár a ritkábban mértek ismétlésével (például historikus erőművi adatok alapján a teljesítmény vizsgálatához a percenként mért égési jellemzőket a naponta gyűjtött üzemanyag adatokkal). Az új verzió a korábbinál nagyobb teljesítményű, jobban skálázható és az eredményként generált jelentés több részletet tartalmaz (például a valós időszakokat is).

Enterprise jelentések emailben. A Statistica Enterprise jelentésgenerátora HTML, PDF vagy RTF formátumú jelentések önműködő előállítására képes. Most a rendszer a frissen elkészült jelentéseket email formájában automatikusan el is küldi a megadott címre.

A beavatkozásokat naplózó rendszer működése is változott, mostantól a bejegyzések időpontja minden esetben univerzális időben kerül tárolásra. A helyi időzóna szerinti konverzióra csak a beavatkozási napló megjelenítéskor kerül sor. Ezzel a módszerrel a különböző időzónákban dolgozó felhasználók számára is világosan látható lesz, hogy melyik változás mikor történt.

WebStatistica licenckezelés. A processzoronkénti licencelése rugalmasabb lett, a megadott processzorszám szabadon megosztható több, kevesebb processzoros szerver között. (Például egy 8 processzoros licenc működhet egy 8 processzoros vagy két független, 4 processzoros szerveren, ha azok a közös licencfájlt használják.)

MSI telepítő rendszer. A Statistica 8 és a korábbi verziók az InstallShield telepítő rendszert használták, az új verzióval áttértünk a Microsoft Installer (MSI) alkalmazására.

Az interaktív telepítés során a felhasználók szebb, de tartalmában a korábbiakkal szinte azonos felülettel fog találkozni.

Az MSI használatának előnyei vállalati környezetben mutatkoznak meg, a Statistica telepítő csomagja más csomagokba integrálható, telepítő eszközökkel kezelhető. Az MSI lehetővé teszi a háttérben futó, „silent” telepítést, ekkor a felhasználótól várt adatbevitelt (CD kulcs, sorszám, netID, telepítő kód, valamint a regisztrációs adatok) közvetlenül parancssori paraméterként, vagy a parancssorban megadható paraméterfájlban lehet átadni.

Az MSI telepítő három fő alkalmazási módja:

  • A Statistica MSI csomagjának integrálása más csomagokkal

  • Vállalati telepítőrendszerek használata egyéni (desktop) telepítésekhez

  • Vállalati telepítőrendszerek használata konkurens hálózati munkaállomások telepítéséhez

További információért forduljon a StatSoft helyi képviseletéhez!

Bővített fejlesztői felület. A Statistica programozott vezérlését biztosító rugalmas és hatékony opciókat is érintette a fejlesztés.

  • A Statistica termékekkel együtt forgalmazott új, kisméretű Statistica Spreadsheet könyvtárat térítésmentesen alkalmazhatják külső fejlesztők a Statistica adatfájlok olvasására és írására. A könyvtár a többszálas technológiát alkalmazza, a .NET környezethez külön többszálas könyvtár készült.

  • A grafikonok eseménykezelése új elemmel egészült ki: Az OnGroupingSelect esemény akkor következik be, ha a felhasználó egy kategorizált grafikonokon objektumot jelöl ki, és információt szolgáltat arról, hogy a választott objektum melyik kategóriába tartozik. Ezzel a kiegészítéssel lehetővé válik egyedi „drill-down” adatfeltáró eszközök kialakítása is.

  • A Statistica Visual Basic makrók korábban minden lehetséges modul hivatkozását tartalmazták. Mostantól csak a szükséges, ténylegesen használt modulok hivatkozásai kerülnek be a makrók fejrészébe, ami lényegesen gyorsítja a makrók indítását. A makró rögzítés és írás során a szükséges hivatkozások automatikusan beíródnak a fejrészbe. A másik makróból származó kódrészleteket a bemásolás során a program ellenőrzi, jelzi és kérésre beépíti a még hiányzó hivatkozásokat.

  • Új parancssori paraméter használható a /RunMacro utasítás mellett: a /MacroArgument paraméterezett makróindítást tesz lehetővé, az átadott értékeket a makró a GetScriptArgument függvénnyel veheti át.

  • A Statistica teljes körűen támogatja az R nyelvű eljárások használatát. Az R a statisztikai számítások céljára fejlesztett, nagyon jól bővíthető programozási nyelv és környezet (//www.r-project.org). Az R programok minden verziója (egészen a leírásunk idején legfrissebb 2.8.1 változatig) végrehajtható Statistica alatt. Az R eredmények natív módon megjeleníthetők Statistica táblázatok és grafikonok formájában. Számos integrálási mód áll rendelkezésre, köztük az R programok futtatása Statistica szervereken. Az integráció részleteit megtalálja honlapunkon. (Integration Options and Features to Leverage Specialized R Functionality in Statistica and WebStatistica Solutions)

  • A Statistica Query mostantól támogatja az ANSI-92 SQL JOIN szintaxist. Az újabb SQL Server verziók igénylik az ilyen típusú kapcsolatok használatát. Az alapértelmezés a régi szintaxis maradt, igény esetén az új típus választható lekérdezésenként, vagy valamennyi lekérdezésre.

Az újdonságok listája PDF formátumban Angol nyelvű oldal
Vissza a lap elejére

© Copyright 2022 StatSoft Hungary