itthon / A PC elsajátítása / Adatbázis koncepció. Követelmények, amelyeknek egy adatbázis-szervezetnek meg kell felelnie Az adatbázissal végzett munka fő követelménye

Adatbázis koncepció. Követelmények, amelyeknek egy adatbázis-szervezetnek meg kell felelnie Az adatbázissal végzett munka fő követelménye

Az óra célja: ismeretek elsajátítása az adatbázis tervezési szakaszainak tartalmáról, az adatbázissal szemben támasztott követelményekről.

Terv

    Adatbázis követelmények

    Az adatbázis tervezés főbb szakaszai.

    Entitás-kapcsolat modell.

  1. Adatbázis követelmények

Az adatbázis-technológiák fejlődését számos tényező határozza meg: a felhasználók információigényének növekedése, az információhoz való hatékony hozzáférés követelményei, új típusú memóriagépek megjelenése és kapacitásának növekedése, új eszközök és lehetőségek a távközlési terület stb.

A modern adatbázisokkal szemben a következő alapvető követelmények vonatkoznak:

    Nagy teljesítmény (rövid válaszidő egy kérésre). Válaszidő - az adatbázishoz intézett kérés pillanatától az adatok tényleges beérkezéséig tartó időtartam. Hasonló kifejezés a hozzáférési idő – az írási (olvasási) parancs kiadása és az adatok tényleges beérkezése közötti időintervallum. A hozzáférés az adatok keresésének, olvasásának vagy írásának műveletét jelenti. Az adatok írási, törlésének és módosításának műveleteit gyakran frissítési műveleteknek nevezik.

    Könnyen frissíthetők az adatok. Ez az első két egymásnak ellentmondó követelmény a legfontosabb: a teljesítmény növelése az adatbázis-struktúra egyszerűsítését igényli, ami viszont bonyolítja az adatok frissítésének folyamatát, növeli azok redundanciáját.

    Az adatfüggetlenség az adatbázis logikai és fizikai szerkezetének megváltoztatásának képessége a felhasználók nézeteinek megváltoztatása nélkül. Az adatfüggetlenség az adattárolás, a szoftver és a hardver természetének változatlanságát jelenti. Minimális változtatásokat biztosít az adatbázis szerkezetében az adatelérési stratégia és maguknak a forrásadatok szerkezetének változtatásával. Ezt úgy érik el, amint az alább látható lesz, az összes változtatást a koncepcionális és logikai tervezési szakaszokba helyezve, minimális változtatásokkal a fizikai tervezési szakaszban.

    Adatmegosztás sok felhasználó között.

    Az adatbiztonság az adatok védelme a szándékos vagy nem szándékos jogsértés, megváltoztatás vagy megsemmisülés ellen. Az adatbiztonság magában foglalja azok integritását és védelmét. Adatintegritás – a tárolt adatoknak a hibás működéssel összefüggő megsemmisüléssel és megsemmisítéssel szembeni ellenállása technikai eszközökkel, rendszerhibákés a felhasználók hibás tevékenységei. Az adatok integritása a következőket jelenti:

1) ugyanarról a tényről pontatlanul bevitt adatok vagy két azonos feljegyzés hiánya;

2) védelem a hibák ellen az adatbázis frissítése során;

3) a különböző táblák kapcsolódó adatainak törlésének (vagy lépcsőzetes törlésének) lehetetlensége;

4) az adatok torzításának elkerülése többfelhasználós módban és elosztott adatbázisokban végzett munka során;

5) adatbiztonság berendezés meghibásodása esetén (adat-helyreállítás).

Az adatbázis integritásának biztosítása érdekében integritási korlátozásokat írnak elő bizonyos feltételek formájában, amelyeket az adatbázisban tárolt adatoknak meg kell felelniük (például az attribútumértékek tartománya stb.):

    entitás integritása- bármely reláció bármely sora megkülönböztethető e reláció bármely többi sorától

referenciális integritás- a hivatkozási relációban megjelenő minden idegen kulcs értékhez a hivatkozott relációnak rendelkeznie kell egy sorral azonos elsődleges kulcs értékkel, vagy az idegen kulcs értékének nullának kell lennie

Az integritást integritás triggerek biztosítják - speciális alkalmazások-programok, amelyek bizonyos feltételek mellett működnek. Az illetéktelen hozzáférés elleni adatvédelem magában foglalja a bizalmas adatokhoz való hozzáférés korlátozását, és elérhető:

1) jelszórendszer bevezetése;

2) engedélyek beszerzése az adatbázis-adminisztrátortól (DBA);

4) típusok kialakítása - az eredetiekből származó és meghatározott felhasználóknak szánt táblázatok.

Az utolsó három eljárás könnyen végrehajtható az SQL nyelven belül.

    Az adatbázis (valójában a DBMS) felépítésének és működésének szabványosítása. A szabványosítás biztosítja a DBMS generációinak folytonosságát, leegyszerűsíti a DBMS egy generációjának adatbázisainak interakcióját azonos és különböző adatmodellekkel. A szabványosítás (ANSI/SPARC) nagymértékben megvalósult a DBMS felhasználói felületén és az SQL nyelven. Ez lehetővé tette a különböző relációs DBMS-ek közötti interakció problémájának sikeres megoldását mind az SQL nyelv, mind az Open DataBase Connection (ODBC) alkalmazás használatával. Ebben az esetben mind a helyi, mind távoli hozzáférés adatokhoz (kliens/szerver technológia vagy hálózati opció).

    Minimális redundancia – minden adatelemet egyetlen példányban kell tárolni.

    Az adatok újrafelhasználása.

    Egyetlen adatbevitel.

    Az érintett tárgykör adatainak megjelenítésének megfelelősége.

    Barátságos felhasználói felület.

Az adatbázis logikai és fizikai szerkezetének megváltoztatásának lehetősége a felhasználók nézeteinek megváltoztatása nélkül.

Az adatfüggetlenség az adattárolás természetének változatlanságát jelenti, szoftverés technikai eszközökkel. Minimális változtatásokat biztosít az adatbázis szerkezetében az adatelérési stratégia és maguknak a forrásadatok szerkezetének változtatásával. Ezt úgy érik el, amint az alább látható lesz, az összes változtatást a koncepcionális és logikai tervezési szakaszokba helyezve, minimális változtatásokkal a szakaszban. fizikai tervezés.

Az adatbiztonság magában foglalja azok integritását és védelmét.

A tárolt adatok stabilitása a technikai eszközök meghibásodásával, rendszerhibákkal és hibás felhasználói lépésekkel összefüggő megsemmisüléssel és megsemmisüléssel szemben.

Azt javasolja:

    1) ugyanarról a tényről pontatlanul bevitt adatok vagy két azonos feljegyzés hiánya;

    2) védelem a hibák ellen az adatbázis frissítése során;

    3) a különböző táblák kapcsolódó adatainak törlésének (vagy lépcsőzetes törlésének) lehetetlensége;

    4) az adatok torzításának elkerülése többfelhasználós módban és elosztott adatbázisokban végzett munka során;

    5) adatbiztonság berendezés meghibásodása esetén (adat-helyreállítás).

Az integritás biztosított integritás triggerek- speciális alkalmazások-programok, amelyek bizonyos feltételek mellett működnek. Az illetéktelen hozzáférés elleni adatvédelem magában foglalja a bizalmas adatokhoz való hozzáférés korlátozását, és elérhető:

    1) jelszórendszer bevezetése;

    2) engedélyek beszerzése az adatbázis-adminisztrátortól (DBA);

    4) típusok kialakítása - az eredetiekből származó és meghatározott felhasználóknak szánt táblázatok.

Az utolsó három eljárás könnyen végrehajtható a Structured Query Language - SQL-en belül, amelyet gyakran SQL2-nek is neveznek.

A szabványosítás biztosítja a DBMS generációinak folytonosságát, leegyszerűsíti a DBMS egy generációjának adatbázisainak interakcióját azonos és különböző adatmodellekkel. A szabványosítás (ANSI/SPARC) nagymértékben megvalósult a DBMS felhasználói felületén és az SQL nyelven. Ez lehetővé tette a különböző relációs DBMS-ek közötti interakció problémájának sikeres megoldását mind az SQL nyelv, mind az Open DataBase Connection (ODBC) alkalmazás használatával. Ebben az esetben az adatokhoz való helyi és távoli hozzáférés is megvalósítható (kliens/szerver technológia vagy hálózati verzió).

Az adatbázis felépítésének fogalma

Érdekes az adatbázisok fogalmának fejlődése.

Kezdetben (60-as évek eleje) használt fájlrendszer tárolás. A túlnyomórészt kis adatmennyiséggel és jelentős mennyiségű számítással jellemezhető mérnöki problémák megoldásához az adatokat közvetlenül a programban tároltuk. Az adatok rendszerezésének következetes módszere volt, nagy volt a redundancia, a logikai és fizikai struktúrák azonossága, az adatok teljes függősége. A nagy adatmennyiséggel és a számítások kis hányadával jellemezhető gazdasági és gazdálkodási feladatok (menedzsment információs rendszer - MIS) megjelenésével ez az adatszervezés nem bizonyult hatékonynak. Adatsorrendre volt szükség, ami, mint kiderült, két szempont szerint hajtható végre: felhasználás (információs tömbök); tárolás (adatbázisok). Kezdetben információs tömböket használtak, de hamar kiderült az adatbázisok fölénye. Fájlok használata csak adatok tárolására (2.1. ábra, a) McGrey javasolta 1959-ben. Az ilyen állományokhoz (beleértve az önkényes) hozzáférési módszereket is kidolgozták, miközben a fizikai és logikai struktúra már más volt, és az adatok fizikai elhelyezkedése a logikai megjelenítés megváltoztatása nélkül változtatható volt.

1963-ban S. Bachman megépítette az első ipari IDS adatbázist hálózati adatmodellel, amelyet még adatredundancia jellemez, és csak egy alkalmazáshoz való felhasználása. Az adatokhoz való hozzáférés a megfelelő szoftver segítségével történt. 1969-ben megalakult egy csoport, amely létrehozta a CODASYL szabványkészletet a hálózati adatmodellhez.

Valójában elkezdték használni (2.1. ábra, b) modern adatbázis architektúra. Az architektúra egy olyan struktúra (általánosítása) alatt értendő, amelyben bármely elem helyettesíthető egy másik elemmel, amelynek bemeneti és kimeneti jellemzői megegyeznek az első elemével. Az adatbázis-technológia fejlődésében jelentős ugrást adott a M. Codd által 1970-ben javasolt relációs adatmodell paradigmája. Paradigma alatt olyan tudományos elméletet értünk, amely a valóság lényeges jellemzőit tükröző fogalomrendszerben testesül meg. Most ugyanazokból a fizikai adatokból lehetne logikai struktúrákat nyerni, pl. ugyanazokhoz a fizikai adatokhoz lehetett hozzáférni különféle alkalmazások különböző utakon. Lehetővé vált az adatok integritásának és függetlenségének biztosítása.

Az 1970-es évek végén megjelentek a modern DBMS-ek, amelyek fizikai és logikai függetlenséget, adatbiztonságot biztosítanak, és adatbázisnyelveket fejlesztettek ki. Az elmúlt évtizedet az elosztott és objektum-orientált adatbázisok megjelenése jellemzi, amelyek jellemzőit a tervezési automatizálási eszközök alkalmazásai és az adatbázis-intellektualizálás határozzák meg.

Mielőtt megvizsgálnánk az adatbázissal való munkavégzés eljárásait, adjunk meg egy adatbázis-jellemzőket (2.2. ábra).
és magyarázatok rá.

Kétféle megközelítés létezik az adatbázis felépítésére, amelyek az automatizált vezérlőrendszer (ACS) létrehozásának két megközelítésén alapulnak.

Közülük az első, a 80-as években széles körben elterjedt, ezért klasszikusnak (hagyományosnak) nevezett, a munkafolyamat automatizálásával (egy vállalkozás folyamatában mozgó dokumentumkészlettel) kapcsolatos. A kezdeti és kimeneti koordináták dokumentumok voltak, amint az a 2.1. példából látható.

2.1. példa. A feladat a következőképpen van felállítva. Létezik egy kézi dokumentumok rendszere, amelyek közül az egyik formája a táblázatban látható. 2.1.

2.1. táblázat.

Szállítási adatok

Az adatbázis segítségével szükséges - az előírásoknak megfelelően vagy kérésre - más dokumentumrendszer formájában információkat szerezni, amelyek közül az egyik formáját a táblázat tartalmazza. 2.2.

2.2. táblázat.

Negyedéves szállítási jelentés

A következő tézis került felhasználásra. Az adatok kevésbé mobilak, mint az algoritmusok, ezért létre kell hoznia egy általános adatbázist, amelyet ezután bármilyen algoritmushoz használhat. Hamar kiderült azonban, hogy egy univerzális adatbázis létrehozása problematikus. Az adatintegráció egészen a közelmúltig uralkodó koncepciója – mennyiségük meredek növekedésével – tarthatatlannak bizonyult. Sőt, alkalmazások is megjelentek (például szöveg, grafikus szerkesztő) széles körben használt szabványos algoritmusok alapján. A menedzsmentben (business) is megjelentek a szabványos algoritmusok, amint az a 2.2. példából következik.

2.2. példa. Fontolja meg a banki hitelkártya használatának szokásos eljárását. A vásárló-ügyfél a szupermarketben kiválaszt egy terméket, és a pénztárhoz közeledve bankkártyát mutat fel fizetéshez. Egy speciális vevőegységbe süllyesztik, az adatokat kiolvassák belőle, és továbbítják a szupermarket számítógépére. Ez a számítógép kommunikál azzal a bankszámítógéppel, ahol az ügyfél pénzét tárolják. A bank számítógépéről az adatok (a vásárlóra vonatkozóan) átkerülnek a szupermarket számítógépére. Ha az ügyfél bankszámláján több pénz van, mint amennyi az általa kiválasztott áru költsége, akkor a piaci számítógép lehetővé teszi az áru kiadását. Ezzel egyidejűleg újraszámolja az ügyfél számláján lévő pénzeszközöket, módosítva a szupermarket pénzügyi dokumentumait, az ügyfél bankszámláját és hitelkártyáját. A megváltozott adatokkal rendelkező hitelkártya visszakerül az ügyfélhez. Ha a vásárlónak nincs elég pénze, a hitelkártya visszaadható a vásárlónak, és a szupermarketben nem szolgálják ki.

Az 1990-es évekre a vezérlés automatizálásához kapcsolódóan egy második, modern megközelítés alakult ki. Ez magában foglalja a szabványos alkalmazási algoritmusok (idegen terminológiával üzleti algoritmusok) kezdeti azonosítását, amelyek alapján az adatok, és így az adatbázis is meghatározásra kerülnek. Az objektum-orientált programozás csak növelte ennek a megközelítésnek a jelentőségét. ábrán látható az adatbázis összetétele a különböző megközelítésekhez. 2.3.

Az adatbázis működésében egy- és többfelhasználós (egy számítógéphez több felhasználó különböző portokon keresztül csatlakozik) módok lehetségesek.

Használjon felülről lefelé és felülről lefelé irányuló adatbázistervezést. Az elsőt az elosztott adatbázisokban használják olyan tervezett helyi adatbázisok integrálásakor, amelyek különféle adatmodellek segítségével hajthatók végre. A központosított adatbázisokra jellemzőbb a felülről lefelé történő tervezés.

A következő részekben először a klasszikus, majd a modern megközelítéssel foglalkozunk a központosított adatbázisok esetében. A tanulmány III. része az elosztott adatbázisokkal foglalkozik.

ábrán látható diagram formájában ábrázolható az adatbázisokkal végzett munka. 2.4.
Ebből látható, hogy meg kell különböztetni az adatbázis létrehozásának és használatának módszertanát. Az adatbázis módszertana a tervezési eljárásban van meghatározva, de a használati eljárásban is megnyilvánul.

Adatbázis tervezési módszertan

Sokféle módszer létezik az adatbázisok klasszikus megközelítésben való figyelembevételére, de ezek leggyakrabban az ANSI / SPARC módszertanhoz ragaszkodnak, amelynek sémája a 2. ábrán látható. 2.5.

ábrán. 2.5 bemutatja a központosított adatbázis tervezésére szolgáló eljárások sorozatát, amely négy szakaszba kombinálható.

A követelmények megfogalmazásának és elemzésének szakaszában meghatározzák a szervezet céljait, meghatározzák az adatbázisra vonatkozó követelményeket. Ezekből állnak Általános követelmények 2.1. szakaszban meghatározottak és egyedi követelmények. Konkrét követelmények kialakításához általában a vezetés különböző szintjein dolgozó személyzet megkérdezésének technikáját alkalmazzák. Minden követelményt a végfelhasználó és az adatbázis-tervező számára hozzáférhető formában dokumentálunk.

A koncepció tervezési szakasza a leírásból és a szintézisből áll információs követelmények felhasználókat az eredeti adatbázisprojekthez. A kiindulási adat lehet felhasználói dokumentumok halmaza (2.4. ábra)
a klasszikus megközelítésben vagy az alkalmazási algoritmusok (üzleti algoritmusok) a modern megközelítésben. Ennek a szakasznak az eredménye a felhasználói információs igények magas szintű reprezentációja (adatbázistábla rendszer formájában), különböző megközelítések alapján.

Először az adatbázis modellt kell kiválasztani. Ezután a DDL segítségével létrejön egy adatbázis-struktúra, amelyet DDL parancsokkal, menürendszerekkel, képernyő formákkal, vagy adatbázis tábla nézet módban töltünk fel adatokkal. Ezenkívül védelmet és integritását (beleértve a hivatkozási adatokat is) biztosítja egy DBMS segítségével vagy triggerek létrehozásával.

A logikai tervezés során az adatok magas szintű reprezentációja átalakul a használt DBMS struktúrájába. A szakasz fő célja az adatredundancia kiküszöbölése speciális normalizálási szabályok segítségével (2.4. ábra).
A normalizálás célja az adatismétlések és az adatbázis esetleges szerkezeti változásainak minimalizálása a frissítési eljárások során. Ezt úgy érik el, hogy egy táblát ketté vagy többre osztanak (felbontják), majd navigációs műveleteket használnak a lekérdezésekben. Vegye figyelembe, hogy a navigációs keresés lelassítja az adatbázis teljesítményét, pl. növeli a lekérdezés válaszidejét. Az így létrejövő adatbázis logikai struktúrája különböző jellemzők segítségével számszerűsíthető (a logikai rekordokhoz való hozzáférések száma, az egyes alkalmazásokban található adatmennyiség, az összes adatmennyiség). Ezen értékelések alapján a logframe javítható a nagyobb hatékonyság érdekében.

Az adatbázis-kezelési eljárás külön tárgyalást érdemel. Egyfelhasználós módban a legegyszerűbb. Többfelhasználós módban és elosztott adatbázisokban az eljárás sokkal bonyolultabbá válik. Ha több felhasználó is hozzáfér egy időben anélkül, hogy különleges intézkedéseket tenne, az integritás sérülhet. Ennek a jelenségnek a kiküszöbölésére a tranzakciós rendszert és a táblák vagy egyedi rekordok zárolási módját alkalmazzák.

Egy fájl, rekord vagy adatbázis módosításának folyamata, amelyet egyetlen bemeneti üzenet átvitele okoz. A blokkolási funkciókról és a blokkolási lehetőségekről az alábbiakban külön lesz szó.

A fizikai tervezés szakaszában a rendszer teljesítményével kapcsolatos kérdéseket megoldják, meghatározzák az adattárolási struktúrákat és a hozzáférési módokat.

A tervezési szakaszok és a szókincsrendszer közötti kölcsönhatást külön kell figyelembe venni. A tervezési eljárások szókincsrendszer hiányában önállóan is használhatók. Maga a szótárrendszer a tervezési automatizálás elemének tekinthető.

A tervezési eszközök és értékelési szempontok a fejlesztés minden szakaszában használatosak. Jelenleg a kritériumok megválasztásának bizonytalansága az adatbázis-tervezés leggyengébb pontja. Ennek oka az alternatív megoldások nagyszámú leírásának és azonosításának nehézsége.

A helyzet egyszerűbb, ha kvantitatív kritériumokkal dolgozunk, amelyek magukban foglalják a kérésre adott válaszidőt, a módosítás költségeit, a memória költségét, a létrehozási időt, az átszervezés költségeit. A nehézségek a kritériumok egymásnak ellentmondását okozhatják.

Ugyanakkor számos optimalitási kritérium létezik, amelyek nem mérhető tulajdonságok, amelyeket nehéz mennyiségileg vagy célfüggvényként kifejezni.

A minőségi kritériumok közé tartozhat a rugalmasság, az alkalmazkodóképesség, az új felhasználók számára való hozzáférhetőség, a kompatibilitás más rendszerekkel, a konvertálás képessége másik számítástechnikai környezetre, a helyreállítási képesség, a terjesztési és bővítési képesség.

A tervezési folyamat hosszú és fáradságos, és általában több hónapig tart. Az adatbázis-tervező fő erőforrásai a saját megérzései és tapasztalatai, így a megoldás minősége sok esetben alacsony lehet.

A tervezett adatbázisok alacsony hatékonyságának fő okai a következők lehetnek:

    a követelmények (a tervezés kezdeti szakaszai) nem kellően mély elemzése, beleértve azok szemantikáját és adatkapcsolatait;

    a strukturálási folyamat hosszú időtartama, ami ezt a folyamatot fárasztóvá és manuálisan nehezen kivitelezhetővé teszi.

Ilyen körülmények között a fejlesztési automatizálási kérdések fontossá válnak.

Adatbázis módszertan

Az adatbázisokat általában nem használják önállóan, hanem különféle összetevők információs rendszerek: adatbankok, információkereső és szakértői rendszerek, számítógéppel segített tervezőrendszerek, automatizált munkahelyek, automatizált rendszerek menedzsment.

Az adatbázisnak három adatmegjelenítési szintje van (2.4. ábra):
fogalmi, logikai és fizikai adatbázisok.

A felhasználási eljárás során leggyakrabban logikai és - sokkal ritkábban - fogalmi és fizikai modellel foglalkoznak.

Az adatszótár olyan, mint egy belső adatbázis, amely központosított információkat tartalmaz az összes adattípusról, azok nevéről, struktúrájáról és a felhasználásukkal kapcsolatos információkról. Az adatszótár előnye a hatékony felhalmozás és kezelés információs források tárgykörben. Alkalmazása lehetővé teszi az adatok redundanciájának és inkonzisztenciájának csökkentését beírásukkor, egyszerű és hatékony kezelést módosításukkor, az adatkezelés központosításával az adatbázis tervezési eljárás egyszerűsítését, más felhasználókkal való kapcsolatok kialakítását. Így az adatszótár mindhárom szint – fogalmi, logikai és fizikai – általánosított ábrázolását tartalmazza.

Ennek a kérdésnek a tanulmányozása hosszú ideje különböző csoportok dolgoztak számítógépet használó intézményekben, kormányzati megbízásokban, kollektív felhasználású számítástechnikai központokban. A CODASYL bizottság jelentéseket tett közzé erről a témáról (a CODASYL a COBOL nyelvet kifejlesztő szervezet). Az IBM SHARE és GUIDE felhasználói szervezetek jelentésükben követelményeket fogalmaztak meg az adatbázis-kezelő rendszerrel szemben. Az ACiM (Association for Computing Machinery) szervezet is tanulmányozta ezt a kérdést.

Az alábbiakban bemutatjuk az adatbázis szervezésének alapvető követelményeit.

Többoldalú kapcsolatok kialakítása

A különböző programozóknak különböző logikai fájlokra van szükségük. Ezek a fájlok ugyanabból az adathalmazból származnak. A tárolt adatok elemei között különféle kapcsolatok lehetnek. Egyes adatbázisok kapcsolatok összetett hálóját tartalmazzák. Az adatok rendszerezési módjának olyannak kell lennie, hogy kényelmesen lehessen ábrázolni ezeket a kapcsolatokat, és gyorsan egyeztetni lehessen a változtatásokról. Az adatbázis-kezelő rendszernek lehetővé kell tennie a szükséges logikai fájlok beszerzését a rendelkezésre álló adatokból és a közöttük fennálló kapcsolatokból. Legalább enyhén hasonlónak kell lennie a logikai fájl alkalmazási programban való megjelenítése és az adatok fizikai tárolásának módja között.

Teljesítmény

A kifejezetten a terminálüzemeltetőik általi használatra tervezett adatbázisok olyan válaszidőket biztosítanak, amelyek kielégítik az ember-terminál párbeszédet. Ezenkívül az adatbázis-rendszernek megfelelő átviteli sebességet kell biztosítania. Azokban a rendszerekben, amelyeket a kérések kis mennyiségére terveztek, áteresztőképesség kisebb korlátozásokat ír elő az adatbázis szerkezetére vonatkozóan. A nagy mennyiségű kéréssel rendelkező rendszerekben, mint például a repülőjegy-foglalási rendszerekben, az átviteli sebesség döntően befolyásolja a fizikai adattárolás szervezetének megválasztását.

A csak kötegelt feldolgozásra tervezett rendszerekben a válaszidő nem olyan fontos, és a fizikai szervezés módja megválasztható a hatékony kötegelt feldolgozás érdekében.

Minimális költségek

Az adatbázis létrehozásának és üzemeltetésének költségeinek csökkentése érdekében olyan szervezési módszereket választanak, amelyek minimálisra csökkentik a követelményeket külső memória. Ezen módszerek alkalmazásakor a memóriában lévő adatok fizikai megjelenítése nagyon eltérhet az alkalmazásprogramozó által használt megjelenítéstől. Az egyik ábrázolás másikká alakítása szoftverrel, vagy ha lehetséges, hardverrel vagy firmware-rel történik. Ilyen esetekben választani kell a konverziós algoritmus költsége és a memóriamegtakarítás között.

Az AIVS-ben használt adatbázisok fogalma

2. szakasz

tesztkérdések

1. Mi az adat, információ, tudás?

2. Adjon meg egy adatbázist (DB).

3. Mi az adatbázis célja?

4. Határozza meg a "fájl", "rekord", "attribútum", "tartomány", "mező", "kulcs", "szuperkulcs", "architektúra", "adatséma", "adatmodell", "tuple" fogalmakat. , "adatszótár".

5. Adjon definíciókat a "tantárgyi terület", "alkalmazás", "program", NDL, NMD fogalmakhoz!

6. Adja meg a DBMS és az adatbázisok osztályozását.

7. Ismertesse a DBMS összetételét!

8. Mutassa be a DBMS és a DBA arányát.

9. Sorolja fel az adatbázis kezelési eljárásait.

10. Nevezze meg az adatbáziselmélet összetevőit!

11. Sorolja fel az adatbázis-struktúra fő elemeit a megvalósítás szempontjából!

12.Mi a célja az OLTP-nek és az OLAP-nak? tulajdonságaik aránya?

13. Ismertesse az OLAP összetételét!

14. Nevezze meg a többdimenziós modell fajtáit!

Az általános értelemben vett fogalom egy folyamatra vagy jelenségre vonatkozó nézetrendszert képvisel. A koncepció összetevői az elvek és a módszertan összessége. A módszertan egy probléma megoldására szolgáló módszerek összessége.

Alapelv – a tevékenység során betartandó szabályok. Az alapelveket gyakran korlátozások és követelmények, különösen az adatbázisokra vonatkozó követelmények formájában fogalmazzák meg.

A modern pozícióktól külön kell figyelembe venni a tranzakciós (működési) adatbázisokkal és adattárházakkal szemben támasztott követelményeket.

Kezdetben felsoroljuk azokat a fő követelményeket, amelyek az operatív adatbázisokra vonatkoznak, és ennek következtében az adatbázis-kezelő rendszerre, amelyre azok épülnek.

1. Könnyen frissíthető adatok. A frissítési művelet az adatok kiegészítésére, törlésére és módosítására vonatkozik.

2. Nagy teljesítmény (rövid válaszidő egy kérésre).
Válaszidő - a kérés pillanatától az adatbázisig eltelt időtartam és
ténylegesen megkapja az adatokat. Hasonló az idő kifejezés
hozzáférés - az írási (olvasási) parancs kiadása és az adatok tényleges beérkezése közötti időintervallum. póni hozzáférés alatt
Az adatok keresése, beolvasása vagy írása folyamatban van.

3. Adatfüggetlenség.

4. Adatok megosztása sok felhasználó között.

5. Adatbiztonság - az adatok védelme a szándékostól
vagy a titoktartás nem szándékos megsértése, félrevezetés ill
megsemmisítés.

6. Az adatbázis felépítésének és működésének szabványosítása (sőt
DBMS).

8. Barátságos felhasználói felület.

A legfontosabb az első két egymásnak ellentmondó követelmény: a sebesség növelése az adatbázis szerkezetének egyszerűsítését igényli, ami viszont bonyolítja az adatok frissítésének folyamatát és növeli azok redundanciáját.

Az adatfüggetlenség az adatbázis logikai és fizikai szerkezetének megváltoztatásának képessége a felhasználók nézeteinek megváltoztatása nélkül. Az adatfüggetlenség az adattárolás, a szoftver és a hardver természetének változatlanságát jelenti. Minimális változtatásokat biztosít az adatbázis szerkezetében az adatelérési stratégia és maguknak a forrásadatok szerkezetének változtatásával. Ezt úgy érik el, amint az alább látható lesz, az összes változtatást a koncepcionális és logikai tervezési szakaszokba helyezve, minimális változtatásokkal a fizikai tervezési szakaszban.

Az adatbiztonság magában foglalja azok integritását és védelmét. Az adatsértetlenség a tárolt adatok megsemmisüléssel és megsemmisüléssel szembeni ellenálló képessége, amely a technikai eszközök meghibásodásával, rendszerhibákkal és a felhasználók hibás tevékenységeivel kapcsolatos.

Azt javasolja:

Hiányzik a pontatlanul bevitt adat, vagy két azonos adat
ugyanazon tény feljegyzései;

Hibák elleni védelem az adatbázis frissítése során;

Különböző táblák kapcsolódó adatainak külön-külön történő törlésének (kaszkádtörlés) lehetetlensége;

Az adatok sérülésmentessége többfelhasználós módban végzett munka során
sajtóban és elosztott adatbázisokban;

Adatbiztonság berendezés meghibásodása esetén (adat-helyreállítás).

Az integritást integritás triggerek biztosítják - speciális alkalmazások-programok, amelyek bizonyos feltételek mellett működnek. Egyes DBMS-ek (például Access, Paradox) triggerek be vannak építve.

Az illetéktelen hozzáférés elleni adatvédelem magában foglalja a bizalmas adatokhoz való hozzáférés korlátozását, és elérhető:

Jelszórendszer bevezetése;

Engedélyek beszerzése az adatbázis-adminisztrátortól (DBA);

Adathozzáférési tilalom a DBA-tól;

Nézetek kialakítása - táblázatok származnak az eredeti és
meghatározott felhasználók számára készült.

Az utolsó három eljárás könnyen végrehajtható a Structured Query Language - SQL-en belül, amelyet gyakran SQL2-nek is neveznek.

A szabványosítás biztosítja a DBMS generációinak folytonosságát, leegyszerűsíti a DBMS egy generációjának adatbázisainak interakcióját azonos és különböző adatmodellekkel. A szabványosítás (ANSI/SPARC) nagymértékben megvalósult a DBMS felhasználói felületén és az SQL nyelven. Ez lehetővé tette a különböző relációs DBMS-ek közötti interakció problémájának sikeres megoldását mind az SQL nyelv, mind az Open DataBase Connection (ODBC) alkalmazás használatával. Ebben az esetben az adatokhoz való helyi és távoli hozzáférés is megvalósítható (kliens-szerver technológia vagy hálózati verzió).

Térjünk át az adattárházakra vonatkozó követelményekre, amelyek szerkezetileg az operatív adatbázisok kiterjesztését jelentik.

A harmadéves hallgatók előmenetelére vonatkozó adatokat tartalmazzon az adatbázis, az ötödik és a hatodik félév aktuális. Az első négy félév adatai az adattárházba (HD), azaz tulajdonképpen egy további, specifikus adatbázisba kerülnek (átvitelre). Az első négy félévben csak kiválóan tanuló hallgatók nevéhez szükséges lekérdezni a tárat.

Vagyis az operatív adatbázis adatai időszakosan átkerülnek az elektronikus archívumba (a vizsgált példában az első négy félév adatai), majd a felhasználó kérésének megfelelően feldolgozhatók.

Mivel a tárolóban lévő adatok gyakorlatilag nem változnak, csak hozzáadódnak, a könnyű frissítés követelménye irrelevánssá válik. Elsősorban - a tárolóban található jelentős adatmennyiség miatt - a nagy teljesítmény követelménye van.

Az adattárolásra a következő további követelmények vonatkoznak:

Nagy teljesítményű adatbetöltés operatív adatbázisokból;

Lehetőség van szűrésre, újraformázásra, ellenőrzésre
a forrásadatok integritása, adatindexelés, metaadatok frissítése;

Fokozott követelmények a kiindulási adatok minőségére vonatkozóan
biztosítsák azok konzisztenciáját, ha lehet
különböző forrásokból szerezték be;

Magas lekérdezési teljesítmény;

Magas dimenzionalitás biztosítása;

Egyidejű hozzáférés az adattárházhoz;

Adminisztrációs eszközök rendelkezésre állása.

Adatelemzés támogatása megfelelő módszerekkel (eszközökkel).

E.F. Codd tapasztalatai alapján a következő követelményeket mutatta be egy OLAP rendszerrel szemben.

1. Az adatok többdimenziós fogalmi ábrázolása.

2. A technológia és az adatforrások átláthatósága.

3. Hozzáférés az adatforrásokhoz különböző adatmodellek használata esetén.

4. Jelentéskészítés következetes elvégzése a mennyiség, a mérések számának növelésével, az adatok általánosítási eljárásaival.

5. Rugalmas, adaptív, méretezhető kliens-szerver architektúra használata.

6. A mérések egyetemessége (képletek és eszközök létrehozásához
a jelentéseket nem szabad meghatározott típusú dimenziókhoz kötni).

7. A mátrix ritkaságának dinamikus vezérlése (üres
A NULL értékeket hatékonyan kell tárolni).

8. Többfelhasználós támogatás.

9. Korlátlan működési kapcsolatok a dimenziók között.

10. Az intuitív adatkezelés támogatása.

11. A jelentési eszközök rugalmassága.

12. Korlátlan számú mérés és általánosítási szint.

A felsorolt ​​követelmények eltérnek az operatív adatbázisokra vonatkozó követelményektől, amelyek speciális adatbázisok - adattárolók - megjelenéséhez vezettek.

1. Adatbázis követelmények

DB - egy sor különleges A repülőgép memóriájában tárolt, az objektumok állapotát és azok kapcsolatait tükröző, rendszerezett adatok.

Az adatbázis szervezésének alapvető követelményei:

1. Többoldalú kapcsolatok kialakítása 2. Termelékenység

3 perc Költségek 4. Min. Redundancia (min. memóriahasználat)

5. Kereshető 6. Integritás (adat-helyreállítás)

7. Biztonság és titoktartás (anélkül - védelem harmadik felek hozzáférése ellen, titkos - kezelési lehetőség nélkül.)

[Hogyan biztosítható a biztonság:

a. Az adatoknak helyreállíthatónak kell lenniük b. Adatkezelési képesség

ban ben. A rendszer nem áll rendelkezésre beavatkozásra

d) Azonosítási eljárás

e. Az adatok védve vannak a lopástól, megsemmisüléstől, megváltoztatástól

e. A felhasználói műveletek ellenőrzése az elfogadhatóság szempontjából]

8. Kapcsolat a múlttal. Verziókompatibilitás

9. Kapcsolat a jövővel. Az adatok el vannak választva az ábrázolásuktól

10. Adatbázis beállítása 11. Adatmozgatás 12. Egyszerűség

2. A DBMS fő összetevői

Absztrakció" href="/text/category/abstraktciya/" rel="bookmark"> egy absztrakció, amely adott adatokra alkalmazva lehetővé teszi a felhasználóknak és a fejlesztőknek, hogy azokat információként értelmezzék, vagyis olyan információként, amely nem csak adatokat, hanem adatokat is tartalmaz. kommunikáció közöttük.

Integritási kényszer - nem ellentmondásos. adat van beállítva. logikus korlátozott

Korlátozott zad-tsya nemcsak az attribútumokhoz, hanem az objektumtípusokhoz és kapcsolatokhoz is.

Kommunikációs típusok: 1:1 1:M M:1 M:M

Adatmodell, amelyet az adatbázis logikai szinten támogat, 3 összetevő határozza meg:

1. Megengedett adatstruktúra, a modell segítségével leírható objektumtípusok változatossága és száma

2. Az adatokkal megengedett műveletek halmaza

3. Az integritás-ellenőrzés korlátai.

Adatmodellek:

0 "style="border-collapse:collapse;border:none">

Munkavállaló

Lényeg

Személyzeti szám

kulcs attribútum

Attribútumok

Születési dátum

Kapcsolatok létesíthetők entitások között – bináris asszociációk, amelyek megmutatják, hogy az entitások hogyan kapcsolódnak egymáshoz vagy hogyan lépnek kapcsolatba egymással. A kapcsolatok lehetnek két entitás között és rekurzívan is.

https://pandia.ru/text/78/193/images/image004_68.gif" width="17" height="17">A kapcsolat lehet

Két entitás között. sokféle értelmű összefüggés lehet. terhelések.

Használhatja az entitások kategorizálásának elvét, azaz örökölheti az entitásokat egymástól (mint az OOP-ban). Azt a szülő entitást, amelyből az altípusok épülnek, szupertípusnak nevezzük.

Az ER modell felépítéséhez rendszerelemzést kell végezni.

A könyvtár számára a könyvek-példányok-olvasók lesznek.

6. Relációs adatmodell.

Az összefüggések matematikai elméletén alapul.

Az adattömb, amelyet relációs struktúrák halmaza képvisel, relációs adatbázist alkot, az RDB sémát pedig kapcsolati sémakészlet fogja képviselni. R1(A11,A12,A13,..A1k) R2(A21,A22,A23,..A2k) R3(A31,A32,A33,..A3k), ahol R-relációk, A-attribútumok. Legyen A, B az R reláció attribútumai.

Azt mondják, mit Bfunkcionálisan attól függA, ha minden időpillanatban minden A ill. legfeljebb egy B érték.

Ha egy az R relációnak sok A1-An attribútuma van, valamint függvényhalmaz. Függ. XàY, ahol X és Y az A1-An részhalmazai, majd a függvényből. Függő, az F készletben található, egyéb funkciók is megjeleníthetők. R-től függ. F+ - bezárás függvénykészlet függőségek, azaz az F-ből beszerezhető függőségek teljes halmaza. Szentek:

1. Reflexivitás: XÍU, YÍU, YÍX, majd XàY

2. utánpótlás: XÍU, YÍU, ZÍU, XàY, majd XÈZàYÈZ

3. tranzitivitás: XÍU, YÍU, ZÍU, XàY, YàZ, majd XàZ

4. kiterjesztések: XÍU, YÍU, XàY, majd "ZÍU XÈZàY

5. folytatások XÍU, YÍU, WÍU, ZÍU, XàY, majd "WÍZ, XÈZàYÈW

6. ál-tranzit. XÍU, YÍU, ZÍU, WÍU, XàY, YÈWàZ, majd XÈWàZ

7. additivitás. X, Y,ZÍU XàY, XàZ, majd XàYÈZ

Tartomány – hasonló adatértékek halmaza

Kapcsolati végzettség a relációban szereplő attribútumok száma.

Erő a sorok száma a relációban.

Szándékosság A(R1..Rn) – intenzitás

Kiterjesztési – relációs sorok némi kitöltése.

Kulcs K R relációk - attribútumok kombinációja, amelyek a következő tulajdonságokkal rendelkeznek:
1. az R reláció minden sorában a k érték egyedileg határozza meg ezt a sort

2. a k kulcsban nincs olyan attribútum, amely az 1. tulajdonság megsértése nélkül eltávolítható lenne.

Ha több lehetséges kulcs is létezik az R-hez, akkor ezek közül az egyik lesz elsődleges.

Az arány normalizálva ha a sor minden komponense egy egyszerű atomi érték, amely nem egy értékcsoportból áll.

A relációs modell elemei

Bemutató űrlap

Hozzáállás

kapcsolati séma

Táblázat fejléce

táblázat sor

Lényeg

Objektum tulajdonságai

Oszlopcím

Az érvényes attribútumértékek halmaza

Attribútum értéke

Rögzítse a mező értékét

elsődleges kulcs

Egy vagy több attribútum

Táblázat elem érték típusa

9. 6 féle egyszerű kérés:

legyen az E1-En objektumok halmaza. Az A1-An attribútumok halmaza. K11-Knm - attribútumtartományok

Kérelem típusa

Attribútum értéke

Melyik objektum rendelkezik az adott értékkel

Melyik tulajdonság számít

Minden objektum attribútum

Ez az attribútum minden objektumhoz

Bármi, ami egyenlő V

10. Konverziós algoritmusERRMD-ben:

1. Minden ER entitás megfelel az RMD relációnak.

2. Minden entitásattribútum a megfelelő reláció attribútumaivá válik.

3. Az entitás elsődleges kulcsa a megfelelő reláció elsődleges kulcsává válik.

4. Minden, az alárendelt entitásnak megfelelő relációhoz hozzáadódik a fő entitás attribútumai, amely a fő entitás elsődleges kulcsa.

5. Egy opcionális típusú kapcsolat fizikai szintű modellezéséhez az idegen kulcsnak megfelelő attribútumok null értékeket fogadnak el. Kötelező típusú kapcsolat esetén ennek az ellenkezője igaz.

6. Az RDM-re való áttéréskor egy entitás kategorizációjának tükrözéséhez több megjelenítési lehetőség is lehetséges. Egy szupertípus összes altípusához csak egy kapcsolat hozható létre. Előny - csak egy kapcsolat jön létre. Hátránya a redundancia. A második megközelítés az egyes altípusok eltérő kapcsolata.

11. NF1, NF2, anomália

1NF : minden kapcsolatattribútum egy egyszerű atomi attribútum, azaz nincsenek összetett attribútumok.

2NF : a kapcsolat normalizált, vagyis minden attribútum teljesen az elsődleges kulcstól függ.

Az anomália egy adatbázistábla olyan helyzete, amely az adatbázis inkonzisztenciájához vezet, vagy jelentősen megnehezíti az adatfeldolgozást.

Az anomáliák típusai:

1. redundancia - ugyanazok az információelemek többször ismétlődnek több sorban.

2. változási anomáliák – ugyanaz az adatrész változik az egyik sorban, de érintetlenül marad a másikban.

3. törlési anomália - ha az értékkészlet kiürül, ez közvetve más információ elvesztéséhez vezethet

Az anomália megszüntetésének egyik módja a reláció felbontása. Az R reláció felbontása magában foglalja az R attribútumok halmazának felosztását, hogy két új reláció sémáját hozzuk létre, majd ebbe a relációba beillesztjük az R-re vonatkozóan meghatározott sorokat. Például a „szállító, termék, ár” táblázatot két részre kell osztani. Másképp:

Bevételi anomália: amíg a szállító el nem kezdi az áruszállítást, addig nem tudjuk megtudni az árura vonatkozó információkat.

Törlési anomália: Ha egy cikk ellátása megszakad, a cikkre vonatkozó összes információ elvész.

Frissítési anomália: ha egy termék ára változik, akkor azt minden szállítótól frissítenie kell.

12. NF3

3NF : az R relációban minden nem elsődleges attribútumnak nincs tranzitív függősége az elsődleges kulcstól.

Például: raktár (cég, raktár, mennyiség)

Minden cég - csak egy raktárból. Cég-raktár, raktár-térfogat

Befoglalási anomália: Ha senki nem kap árut a raktárból, annak mennyiségét nem ismerjük

Törlési anomália: ha az utolsó cég leállítja az áruk fogadását a raktárból, a raktárról információ elveszik

Frissítési anomália: ha a készlet mennyisége változik, akkor minden cégnél minden mennyiséget módosítani kell

Megerősített 3NF: relációban az elsődleges tulajdonságok nem függenek a nem elsődleges tulajdonságoktól.

Vagy Szükséges, hogy minden funkcionális tartomány. a függőségek lehetséges kulcsok voltak

Például projekt (részletek, projekt, szállító)

A projektnek több részlete is van. Minden részlet csak egy szállítótól származik. Minden szolgáltató csak egy projekt.

Alkatrész, Projektszállító

Szállítóprojekt

Beépítési anomália: Az alkatrészek leszállításának ténye nem rögzíthető mindaddig, amíg az alkatrészek használatban vannak.

Törlési anomália: Ha a szállító nem szállít semmit, meg kell ölni

Frissítési anomália: Ha bármely típusú alkatrész szállítója megváltozik, akkor az összes sort meg kell változtatni

13. Példa az NF1,NF2,NF3-ra

Tanár-tantárgy kapcsolat

Sz. tanár

Termék név

Órák száma

A tanár vezetékneve

Munka megnevezése

Összetett kulcs tanári számmal, tantárgynévvel való kapcsolat.

Funkcionális függőségek:

Beosztás-bér, szám-vezetéknév, osztály-telefon, beosztás-bér

Van egy tranzitív függőségi szám-osztály-telefon. Tehát a kapcsolat 1NF-ben van. A tanár vezetéknevének, beosztásának, fizetésének hiányos funkcionális függése van a tanár kulcsszámának egy részétől. Ez a hiányos függőség a következő rendellenességekhez vezet:

1. duplikált az adat a tanárokról.

2. az adatredundancia problémája. A fizetés változása a tuple változásához vezet

3. Egy olyan tanárral van baj, aki nem tanít tantárgyakat.

4. Ha a tanár levelek, el kell távolítania az elemet.

A 2NF-re lépéshez az összetett kulcsot részekre bontjuk, és függőséggel osztjuk:

Vannak tranzitív függőségek szám-osztály-telefon, szám-ügyelet-bér

Ez anomáliákhoz vezet:

1. a telefonadatok megkettőzése

2. A telefoncsere minden tanárt arra kényszerít, hogy keresse

3. Új tanszékről nem lehet adatot felvenni, ha ott nincsenek tanárok.

Menjünk a 3NF-hez

14. Áttérés 4NF-re

Többértékű függőségről van szó, ha adott X attribútumértékek esetén van egy halmaz, amely 0 vagy több egymással összefüggő Y attribútumértékből áll, és az Y attribútumértékek halmaza az attribútumértékhez van társítva. U-X-Y arány, ahol U a kapcsolati attribútumok teljes halmaza.

Többértékű függőség megnevezése X->>Y.

A többértékű függőség axiómái

1. kiegészítés X >Y, majd X->>U-X-Y

2. utánpótlás Ha X >Y, majd WuX->>VuY

3. tranzitivitás Ha X >Y, X->>Z, majd X->>Z-Y

További következtetési szabályok többértékű függőségekre

1. szakszervezet Ha X >Z, X->>Y, majd X->>YuZ

2. áltranzitivitás Ha X >Y, WuY->>Z, majd WuX->>Z-WuY

3. a tranzitivitás vegyes szabálya Ha X >Y, XuYàZ, majd XàZ-Y

4. bontási szabály X >X, X->>Z, majd X->>X^Z, X->>Y-Z, X->>Z-Y

Vegye figyelembe a függőséget (#, tanfolyam, gyerekek, pozíció)

M:M kapcsolat tanár és tanfolyam között

Tanár és gyerekek között 1:M

Többértékű függőségek №->> tanfolyam, №->> gyerekek

Egy relációs séma akkor van a 4NF-ben, ha többértékű X->>Y függőség esetén Y nem üres, és nem X részhalmaza, és XvY nem tartalmazza R összes attribútumait, X tartalmazza k-n kulcs Az R relációk, amelyek között többértékű függőség van, külön relációkra különül el

R1(#,tanfolyam) R2(#,gyerekek) R3(#,pozíció)

A kapcsolatok normalizálása sémáik dekompozíciójával történik. A dekompozíciónak garantálnia kell a reverzibilitást, azaz biztosítania kell, hogy az eredeti relációkat úgy kapjuk meg, hogy egy összekapcsolási műveletet hajtunk végre a vetületeiken.

A visszafordíthatóság jelentése:

1. Nincs sor elvesztése 2. A korábban hiányzó sorok nem jelennek meg 3. A funkcionális függőségek megmaradnak

15. Áttérés 5NF-re

Kapcsolat az 5NF-ben<=>az V kapcsolattól való bármilyen függőséget a lehetőség határozza meg. R kulcsai különben R minden vetülete legalább egy lehetséges kulcsot és legalább egy nem elsődleges attribútumot tartalmaz

A kapcsolat normalizálási folyamata szekvenciálisan kiküszöböli a következő típusú függőségeket:

1. nem kulcsjellemzők részleges függőségei a kulcstól

2. a kulcson kívüli attribútumok tranzitív függőségei a kulcson

3. a kulcsok függőségei a nem kulcs attribútumoktól

4. többértékű függőségek

16. Csatlakozás veszteség nélkül Megőrző függőség

Az áramkör összes lehetséges dekompozíciója közül csak azokat szabad használni, amelyek rendelkeznek a kapcsolatmentes tulajdonsággal. veszteség. Legyen az R séma funkcionális függőségek halmaza. Egy R áramkört veszteség nélkül felbonthatónak mondunk R1,R2,Rk relációkra, megőrizve a funkcionális függést, ha az R-ből minden r sorra r visszaállítható a vetületeinek összekapcsolásával.

A kapcsolat megszakadásának feltétele:

Ha R1 és R2 R dekompozíciója, funkcionális függőség csökkentésével - ez a dekompozíció veszteségmentes kapcsolatot biztosít, miközben megőrzi a funkcionális függőséget<=>ha R1^R2àR1-R2 vagy R1^R2àR2-R1 többértékű függéssel R1^R2->>R1-R2, vagy R1^R2->>R2-R1

A metszés- és különbségműveletek a kapcsolati attribútumlistákon vannak definiálva.

Példa:

Alkalmazottak (#, osztály, város)

1 bővítés E1(#, részleg) E2(#, város)

2 bontás E3(№, osztály) E4(részleg, város)

1. E1^E2=Szám E1-E2=Osztály E2-E1=Város. №àosztály, №àcity a feltétel teljesül, a bővítés veszteségmentes.

2. E3^E4=osztály E3-E4=E4-E3=város. osztály, osztály-város, ezek a függőségek nem léteznek az eredeti dekompozícióban, és az eredeti funkcionális függőségek elvesznek, ami azt jelenti, hogy ez a dekompozíció veszteséges.

Kettőnél több arányú bővítéshez a Tablo módszer használható

17. Eredménytábla módszer

Adott a funkcionális függőségek halmaza, a dekompozíció eredményeként kapott relációs séma. Az eljárás egy olyan táblázat összeállításából áll, amelynek sorai felbontott relációk, oszlopai pedig ezen relációk attribútumai ismétlések nélkül. A táblázat akkor töltődik ki az aj karakterrel, ha a j oszlop i sorának elemei megfelelnek az Ri reláció Aj attribútumának, ellenkező esetben a bij be van állítva. A táblázat összeállítása után meg kell tekinteni az XàY összes funkcionális függőségét Ha az X-ből származó attribútumokhoz vannak olyan sorok, ahol aj van a megfelelő helyen, akkor ezeknek a soroknak az Y-ből származó attribútumok oszlopainak megfelelő bij elemeit aj helyettesíti. . Ha az eredmény egy aj-vel teljesen kitöltött táblázatsor, akkor ez veszteségmentes összekapcsolás.

Példa: R(A, B,C, D) F.Z. AàC, BàC, CàD.

Felbontva: R1(A, B) R2(B, D) R3(A, B,C) R4(B, C, D)

Vannak sorok, amelyekben minden a veszteségmentes dekompozíció szerepel.

18. Relációs algebra.

Két műveletcsoport: Hagyományos: egyesülés, metszéspont, különbség, derékszögű szorzat Szakterület: vetítés, kényszer, egyesülés, osztás.

Egy egyesület Ennek a műveletnek az alkalmazása eredményeként olyan relációt kapunk, amely egyesíti a sorokat. A forráskapcsolatoknak azonos attribútumokkal kell rendelkezniük, azaz össze kell vonni őket

útkereszteződés Szerezze be az azonos típusú sorokat, közös az R1 és R2 számára

Különbség Az R1-ben szereplő sorokat kapjuk, de az R2-ben nem

Descartes termék Az oszlopokat úgy kombináljuk, mint egy normál DP-ben

Kivetítés A művelet az, hogy az oszlopokat az R relációból választjuk ki, és a megadott sorrendben rendezzük el

Korlátozás Tartalmazzon a kimeneti relációban olyan sorokat, amelyek megfelelnek az adott megszorításnak. Példa: R

Összetett Inverz vetítési művelet. Két kapcsolat felvétele és összekapcsolása a megadott attribútummal (JOIN) történik: Példa: R1∞R2

Osztály R1÷R2=P1,2..n-m(R1)-P1,2..n-m(P1,2..n-m(R1)xR2-R1)

Ahol R1-n lokális reláció, R2-lokális reláció n>m. A kezek nem értek el

19. Relációszámítás változó sorokkal

Képlet relációs kalkulus az aritmetikai műveletek mellett további logikai műveletek(A és E). Az AND, OR, NOT műveleteket is használják.

Képletek A relációs számítások atomokból és aritmetikai és logikai operátorok halmazából épülnek fel, a relációs számítási kifejezés változó sorokkal így nézhet ki:

(r|Ψ(r)), ahol r-sor, Ψ(r) valamilyen számítási képlet.

Példa;(r|R1(r)^R2(r)) – meg kell kapnia az összes sor halmazát úgy, hogy azok az R1 és R2 relációkhoz tartozzanak.

Formula Atomok három típusa van:

1. R(t), ahol R a reláció neve, t egy sor a relációban

2. s[i]θu[j], ahol s és u változó sorok, θ aritmetikai operátor. i, j az érdekes oszlopok számai vagy nevei. S[i]- i-edik komponens sorváltozó S u[j]-… 3. s[i]θa, vagy aθs[i], ahol a=const.

Belépés x változót az RI képletbe Ψ(x) összefüggő, ha a képletnek abban a részében van, amely az A vagy E kvantorral kezdődik, amelyet közvetlenül az x változó követ. Ilyen esetekben azt mondják, hogy a kvantor leköti. A kötött változó fogalma analóg a lokális változó fogalmával, a kötetlen a globális változóval.

Az RI kifejezés biztonságos, ha:

1. Ψ(t) igazságából következik, hogy a t sor minden komponense D(Ψ)-hez tartozik.

2. A Ψ-ben szereplő bármely (Eu)(Ψ1(u)) alakú részképletre a Ψ1(u) igazságából következik, hogy u D(Ψ1)-hez tartozik.

3. A Ψ-ben szereplő bármely (Au)(Ψ1(u)) alakú részképletre Ψ1(u) igazságából következik, hogy u nem tartozik D(Ψ1)-hez.

A D(Ψ) halmazt a következőképpen definiáljuk tényleges kapcsolati funkció , amelyet a Ψ(t) képletben jelenlévő állandók Ψ(t)-jében és a θ(t)-ben szereplő relációk sorainak elemei között jelölünk.

D(Ψ)=(a1Ψ)U(a2Ψ)U…U(anΨ)UP1(R1)U…UPk(Rn), ahol aiΨ állandó, találkoznak. A Ψ(t) képletben

Пi(Rj) – a Ψ(t) képletben talált R1-Rn tényleges relációk sorainak vetületei, vagyis jelen esetben sorok komponensei.

Mindenkinek relációs algebra kifejezés, van egy ekvivalens biztonságos kifejezés a relációs kalkulusban változókkal a sorokon.

20. Relációs számítás tartományok változóival.

Ugyanúgy van megszerkesztve, mint a sorszámítás (ugyanazokkal az operátorokkal).

1. Mi van ott Ez az atom azt jelzi, hogy azoknak az xi-knek, amelyek változók, értékének kell lennie úgy vannak kiválasztva, hogy (x1..xk) R sora legyen.

2. xθy, ahol x, y-const vagy változók valamelyik tartományban. A θ egy aritmetikai összehasonlító operátor, az atom jelentése az, hogy x és y azok az értékek, amelyeknél xθy igaz. A tartományváltozókkal rendelkező RI képletek szintén A, E, ÉS, VAGY, NEM karaktereket használnak. Hasonlóképpen fogalmak használatosak szabad és kötött változó.

A tartomány változóit tartalmazó RI képlet alakja: (x1..xk|Ψ(x1..xk)), ahol Ψ egy képlet azzal a tulajdonsággal, hogy csak a tartományokon lévő szabad változói különböznek. Változás. X1..Xk.

Kifejezés A tartományváltozókkal rendelkező RI az biztonságos, ha

1. Ψ(x1..xk) igazságából következik, hogy xi D(Ψ)-hez tartozik.

2. Ha létezik és (Eu)(Ψ1(u)) Ψ részképlete, akkor Ψ1(u) igazsága azt jelenti, hogy u D(Ψ1)-hez tartozik.

3. Ha bármely u (Au)(Ψ1(u)) részképlete Ψ1(u)-nak, akkor u nem tartozik D(Ψ1)-hez.

Minden kifejezés a tartományok változóival, van egy ekvivalens relációs számítási kifejezés a sorokban lévő változókkal.

A kifejezés a következőképpen épül fel:

1. Ha t a k aritás sora, akkor k új változót vezetünk be a t1..tk tartományokon 2. Az R(t) atomokat R(t1..tk) atomok helyettesítik. 3. A t[i minden szabad előfordulása ] helyébe ti 4 kerül. Minden kvantumhoz (Eu) és (Au) m új változót vezetünk be az u1..um tartományokon, ahol u a sor aritása. Valaminek a területén a következő helyettesítéseket hajtják végre:

RmàR(U1..Um) U[i]àUi EUàEU1..EUm AUàAU1..AUm

Teljesített a kifejezés felépítése (t1..tk|Ψ`(t1..tk)), ahol Ψ’ a Ψ, amelyben a megfelelő helyettesítéseket végrehajtják.

21. Algebrai nyelvek és számítási nyelvek összehasonlítása.

Calculus nyelvek nem procedurális nyelvek, mert mindent ki tudnak fejezni, amire szükség van, és nem szükséges meghatározni, hogyan lehet megszerezni.

A kifejezés valódi. Algebra éppen ellenkezőleg, meghatározza a műveletek végrehajtásának konkrét sorrendjét. Példa: ISBL (Information System Base Language).

Nyelvi példa tartományokon: QBE Nyelvi példa sorokon: SQL

SQL : Nem eljárási nyelv. Általában valamilyen programozási nyelv környezetébe van beépítve. Az adathozzáférésre összpontosít, és nem rendelkezik fejlesztői nyelv tulajdonságaival.

A beépített használatának módjaiSQL:

1. Statikus: SQL nyelvi funkciókat tartalmaz. exe fordítás után

2. dinamikus: SQL hívások dinamikus felépítése és értelmezése. Akkor használatos, ha a kérés formája nem ismert előre.

DDL (Leírás) Táblázat létrehozása, táblázat eldobása, tábla módosítása, nézet létrehozása, nézet eldobása, nézet módosítása, index létrehozása, index létrehozása.

DML(Manipulation)törlés(sorok törlése), beszúrás(beszúrás), frissítés(frissítés).

DQL(Query) Válassza ki

DCL (Adatvezérlő nyelv) A hozzáférés szabályozására használatos.

Jelszó módosítása, engedélyezés, újraélesztés.

TRANZAKCIÓKEZELÉS Kötelezettségvállalás, visszaállítás

22. Tranzakciók

Tranzakció típusok:

1. Lapos (klasszikus, SAV). Tulajdonságok:

atomos állapot- a tranzakciót teljes egészében, vagy egyáltalán nem kell teljesíteni

következetesség– a tranzakció nem sérti az adatok kölcsönös megegyezését

elkülönítés– az adatbázishoz való hozzáférésért versengő tranzakciók feldolgozása ténylegesen szekvenciálisan történik.

tartósság- ha a tranzakció lezajlik, annak változásai örökre megmaradnak, még akkor is, ha a későbbiekben hiba történik.

Tranzakció véglegesítése – a megváltozott adatok lemezre írása. Ezt követően más tranzakciók számára is láthatóak lesznek.

Tranzakció visszaállítása - törlés.

A DBMS-ben a mentés elve meg van szervezve. int. comp. a tranzakció megerősítését vagy visszaállítását egy speciális karbantartási mechanizmus biztosítja, amelyhez tranzakciós napló készül. Úgy tervezték, hogy biztonságosan tárolja az adatokat egy adatbázisban. Ez a követelmény feltételezi, hogy az adatbázis állapota összeomlás után visszaállítható.

A helyreállítás alapelvei:

1. A lekötött tranzakciók eredményének szerepelnie kell az adatbázisban.

2. A nem lekötött tranzakciók eredményeinek hiányoznia kell.

A következő helyzetek lehetségesek, amelyekben az adatbázis állapotának visszaállítása:

1. Egyedi tranzakció visszaállítása (normál, rendellenes leállás, letiltás következtében).

2. Helyreállítás a RAM-ban történt adatvesztés után (soft error) (áramkimaradás, processzorhiba)

3. Visszaállítás a fő adatbázis adathordozójának meghibásodása után (kemény hiba). A helyreállítás alapja egy archív másolat és egy adatbázisnapló.

A helyreállítás alapja a redundáns adattárolás. A redundáns adatokat a napló tárolja, és információkat tartalmaz az adatbázisban bekövetkezett változásokról. 2 lehetőség van:

1. Minden tranzakcióhoz külön (helyi) napló – a visszagörgetésekhez.

2. Globális napló az összeomlás helyreállításához.

23. Tranzakciók párhuzamos végrehajtása

A tranzakciók párhuzamos végrehajtásának kielégítőnek kell lennie. vágány. körülmények:

1. A tranzakció végrehajtása során a felhasználó csak konzisztens adatokat lát.

2. Ha 2 tranzakció párhuzamosan kerül végrehajtásra, a DBMS garantálja a független végrehajtást. Ezt hívják tranzakció-szerializálásnak. Általában a reteszelő mechanizmussal hajtják végre. A legegyszerűbb módja az objektum zárolása (szinkron rögzítése) a tranzakció idejére. Előfordulhat oldalszintű blokkolás is. Zárak típusai (rögzítések):

1. Együttes (megosztott). Lágy blokkolás. Az objektum beolvasásakor végrehajtódik.

2. Merev (kizárólagos). Egy objektum exkluzív rögzítése írási művelethez.

Holtpontok lehetségesek. Detektálásuk alapja egy tranzakcióvárakozó gráf felépítése. Ezután az egyik tranzakciót (a legolcsóbbat) feláldozzák - visszagörgetést hajtanak végre rá.

24. Hierarchikus adatmodell.

A legegyszerűbb. Először jelent meg. Fő információs egységek adatbázis, mező, szegmens.

Terület – min. és egy független adategység, a felhasználó rendelkezésére áll DBMS segítségével.

Szegmens (DBTS) - rekordnak nevezik.

Szegmens típusa adattípusok elnevezett gyűjteménye.

Szegmens példány meghatározott mezőértékekből alakul ki.

Minden típusú szegmens a hierarchikus modellen belül homogén rekordok bizonyos halmazát alkotja. Minden szegmenstípushoz tartozhat egy kulcs.

A szegmenseket egy fa digráfba egyesítjük.

Szegmens típusa, nah-xia tovább magas szint hierarchiának hívják log. eredeti alatta lévő szegmenstípusokkal kapcsolatban. (log. beosztottaknak).

A hierarchikus adatbázis sémája egyedi fák gyűjteménye. A modellen belül minden fát fizikai fának nevezünk. DB és megfelel a következőknek korlátozások:

1. 1 gyökérszegmens van

2. Minden napló. Ref. Elem m. b. tetszőleges számú beosztotthoz kapcsolódik.

3. Minden logikailag alárendelt szegmens lehet. csak az egyik szülőhöz kapcsolódik.

Szegmens van példa szegmens típusa. A szegmenspéldányok között is van hierarchikus kapcsolat.

Ikrek - azonos típus leszármazottai egy őssel.

A szegmens összes példányának halmaza egyetlen fában, melynek neve fizikai Felvétel A fizikai adatbázisok halmaza fogalmi adatbázist alkot.

Fizikai elhelyezés megszervezéséhez a következő módszercsoportokat használják:

1. Soros eloszlású lineáris listával való ábrázolás. memória

2. Nemlineáris lista

Alapvető integritás-ellenőrzési szabály: egy gyerek nem létezhet szülő nélkül, és néhány szülőnek nem lehet gyereke.

Nincsenek mechanizmusok az egyes fák közötti integritás fenntartására.

(+) 1. Hatékony használat számítógép memória

2. Nagy sebességű adatműveletek

3. Kényelmes a hierarchikusan rendezett adatokkal való munkavégzéshez

5. Az osztályok tartalmazhatnak metódusokat.

6. Az osztályok tartalmazhatnak metódusgenerátorokat.

7. Sok Általános tulajdonságok Az objektumok viselkedését a gyorsítótár automatikusan kezelheti. Ezenkívül az objektumok viselkedését a felhasználó meghatározhatja.

Osztálytípusok:

adattípus osztályok

Objektum osztályok

Nem regisztrált osztályok

Regisztráció osztályok

Beágyazott osztályok

Tárolt osztályok

Adattípus osztályok: Ezek speciális osztályok, amelyek meghatározzák további értékeketállandók, és lehetővé teszi azok ellenőrzését. Definíciót tartalmaz érvényesítési módszerek összessége. Nem tartalmazhatnak St.

Objektum osztályok: meghatározza az adott típusú objektumok szerkezetét és viselkedését. Az objektumokat a megfelelő osztály példányainak nevezzük. Minden osztálynak van neve, tulajdonságai és metódusai.

Nem regisztrált órák: minden metódusukat a fejlesztő határozza meg, aki felelős az egyedi azonosítók, objektumok és objektumhivatkozások hozzárendeléséért és karbantartásáért.

Korlátozások:

1. A rendszer nem foglal le memóriát az objektumtulajdonságok értékéhez.

2. Az objektum, amelyhez a hivatkozás létrejön, automatikus cseréje nem történik meg. 3. A polimorfizmus nem támogatott.

4. A nem regisztrált objektumokra utaló változókat a megfelelő osztállyal kell deklarálni.

Regisztrált osztályok van teljes készlet mód. Objektumkezelési metódusok automatikus öröklése a rendszerosztályból. A példányok átmenetileg léteznek a folyamatmemóriában. Ezeket ideiglenes objektumoknak nevezik. A gyorsítótár új objektumokat, regisztrált osztályokat hoz létre, és kezeli azok elhelyezését a memóriában. A könyvtárban nyilvántartott objektumtól örökölték. Lehetővé teszik a polimorfizmust.

Beágyazott osztályok nem csak ideiglenesen tárolható a memóriában, hanem hosszú ideig az adatbázisban is. Ezek az osztályok viselkedésüket a Library Serial Object osztálytól öröklik. A viselkedésükben az a lényeg, hogy a memóriában lévő példányok független objektumokként léteznek, és csak más objektumokba ágyazva tárolhatók az adatbázisban.

A tárolt osztályok egy példány hosszú távú tárolását biztosítják az adatbázisban. A Library Persistent-től örökölt. A példányok egyedi objektumazonosítókkal rendelkeznek, és egymástól függetlenül tárolhatók a gyorsítótárban. Amikor egy tárolt objektumot egy osztály tulajdonságaként használunk, akkor a tárolt objektumokra való hivatkozásról beszélünk.

Osztályelemek:

1. Név

2. Kulcsszavak

3. Tulajdonságok, vagyis az osztályban tárolt adatelemek. Lehetnek állandók, beépített objektumok és tárolt objektumokra való hivatkozások. Az adattípus osztályok nem tartalmaznak tulajdonságokat. A tulajdonságok elérésekor formátummódosítások és egyéb átalakítások lehetségesek. A hivatkozott objektumok automatikusan betöltődnek a memóriába. Az ingatlanok lehetnek nyilvánosak és magántulajdonok.

4. Metódusok, vagyis bizonyos funkciókat megvalósító kód.

5. Osztályparaméterek, értékek, amelyek a fordításkor az osztályt alkotják.

Az adattípusokat osztályok szerint valósítják meg.

Az osztályok tudnak

1. Végezzen adatkonverziót az adatbázisban, a memóriában, a memóriában tárolt és a megjelenített formátumok között.

2. Felelős az értékek érvényesítéséért

3. Biztosítson interakciót SQL-lel, Java-val, ActiveX-szel.

Különbségek az objektumosztályoktól.

1. Lehetetlen példányosítani

2. nem tartalmazhat tulajdonságokat

3. metódusok az adattípusok felületén keresztül jutnak a programozó rendelkezésére

4. Vannak módszerek az értékek ellenőrzésére.

Gyűjtemény

A több értékkel rendelkező tulajdonságok a gyorsítótárban gyűjteményekként jeleníthetők meg. Konstansokat, objektumokat és objektumhivatkozásokat tartalmazhat.

Tömbgyűjtemény: minden elem kulcs szerint van rendezve.

A gyűjtemény egy lista: az elem pozíciója a kulcs.

Jelentése

Mód – az objektum által végrehajtható műveletek. Minden argumentumnak van neve, paraméterei stb.

Vannak példánymetódusok és osztálymetódusok (statikus)

A módszerek típusai:

Kód – ObjectScript nyelvű kódot tartalmaz.

Kifejezés – egy kifejezést tartalmaz. Lefordításkor az összes metódushívást ez a kifejezés helyettesíti.

Lekérdezések – tároltként ábrázolhatók SQL eljárások vagy reprezentációk. Az eredmények egy speciális felületen keresztül érhetők el.

Indexek – A lekérdezés végrehajtási sebességének optimalizálására szolgál. Minden index egy vagy több osztálytulajdonság alapján jön létre. A rendezési mód meghatározható

Tárgy koncepció

relációs

példa

objektumazonosító

tulajdonság állandó

külső kulcs

beágyazott objektum

egyes oszlopok

gyűjteménylista

kombinált mező oszlop

gyűjteménytömb

Altáblázat

adatfolyam

tárolt eljárás

osztályos módszer

tárolt eljárás

A relációs modellnek nincsenek analógjai az osztályparaméterekre, a többdimenziós tulajdonságokra és a példánymódszerekre. A Cache fordító automatikusan generál táblázatokat az összes tárolt osztályhoz.

32. Világegyetem

Világegyetem egy kiterjesztett relációs modell, amely megszünteti a táblákban lévő adatok oszthatatlanságának korlátozását. Lehetővé teszi a többértékű mezőket (olyan mezőket, amelyek értékei részértékekből állnak). A többértékű mezők értékkészlete a fő táblázatba ágyazott önálló táblázatnak minősül. Ez a posztreláció a többszintű társított mezőket is támogatja. A társított mezők halmazát társításnak nevezzük. Ebben az esetben a társítás egyik oszlopának első értéke megfelel a társítás összes többi oszlopának első értékének. A második értékek hasonló módon kapcsolódnak egymáshoz. A rekordokban a mezők hosszára és a mezők számára nincs állandóság-megkötés.

Előnyök: a lakosság képviseletének lehetősége kapcsolódó táblázatok egysoros táblázat.

Hibák: az adatok integritásának és konzisztenciájának problémája megoldásának összetettsége.

33. Adattár

A tranzakciós adatok eredményei elhelyezhetők a repository-ban, illetve konvertálhatók a más forrásból érkező adatok kompatibilitása érdekében. Az adatok kivágásának és kinyerésének biztosítására a következő kifejezéseket használjuk: rétegződés, felosztás.

A tárolt adatok többdimenziós modellezési technikákkal módosíthatók egy dimenziótáblákkal körülvett ténytáblából álló csillagséma használatával.

Kép

A ténytáblázat és a méretek közötti kapcsolatnak egyszerűnek kell lennie, hogy minden világos legyen. M. b. méretbővítési táblázat