Proiect Cautarea proiectului pe situl web Cercetare-Dezvoltare-Inovare
    ► http://194.102.64.7/CEEXResurseUmane/
        ► Proiecte de cercetare pentru tinerii cercetatori (ET)
            ► Competitie: octombrie 2005
                ► Director de proiect: jantschi
Vizibilitatea proiectului pe site-ul GetCited: http://www.getcited.org/pub/103436130
Vezi rapoartele de cercetare pe ani: 2006, 2007, 2008 (final).
Nume Distributia Binomiala: Modelare Statistica, Optimizare Numerica, cu Aplicatii in Bioinformatica si Biochimie
Cod 46
Scop Implementarea si utilizarea unui sistem integrat online care sa permita exprimarea intervalelor de incredere la pragul de semnificatie de 95% pentru expresii de variabile ce urmeaza distributia binomiala si utilizarea acestui sistem la exprimarea intervalelor de incredere la aplicatii concrete in bioinformatica si biochimie
Motivatie Cercetarile realizate de coinvestigatorul si investigatorul proiectului, materializate prin sustinerea tezei de doctorat de catre coinvestigatorul proiectului (Teza de doctorat: Medicina Bazata pe Evidente: Logistica si Implementare, sustinuta la Univ. Iuliu Hatieganu in anul 2005).
Personal
NUME PrenumeAfiliereRol
JANTSCHI LorentzUTCNInvestigator principal
BOLBOACA Sorana DanielaUMFIHCoinvestigator
STOENOIU Carmen ElenaUTCNCercetator in formare
AVRAM Camelia ClaudiaUTCNCercetator in formare
CIMPAN SoranaESIAConsultant tehnologia informatiei
VOICULESCU IrinaOUUKConsultant modelare matematica
Infrastructura Suportul pentru realizarea proiectului l-a constituit baza de cercetare a Universitatii Tehnice din Cluj-Napoca (UTCN) si a Universitatii de Medicina si Farmacie Iuliu Hatieganu Cluj-Napoca (UMFIH) si facilitatile oferite prin colaborarea cu alte institutii: Oxford University, United Kingdom (OUUK) si Ecole Superieure d`Ingineurs d`Annecy, Cedex, France (ESIA).
Subiect Binomial Distribution Confidence Intervals: Intervale de incredere pentru expresii de variabile distribuite binomial.
Sistemul creat este disponibil online: binomial_distribution si confidence_intervals.
DESCRIERE
Introducere
► [binomul lui Newton (a+b)^N] Originile distributiei binomiale se gasesc in lucrarea fundamentala a lui Isaac NEWTON [1643-1727], Philosophiae naturalis principia mathematica, London, England, 1687.
► [distributia lui Bernoulli si distributia binomiala] Bazele matematice ale studiului distributiei binomiale au fost puse de Jacob BERNOULLI [1654­1705] - studiile au fost publicate la 8 ani dupa moartea sa de catre nepotul sau, Nicolaus BERNOULLI: Ars Conjectandi, Basel, Switzerland, 1713. In capitolul Doctrinam de Permutationibus & Combinationibus a acestei lucrari fundamentale, el demonstreaza binomul lui Newton.
► [aproximarea distributiei binomiale] Abraham DeMOIVRE [1667-1754] utilizeaza distributia normala pentru aproximarea distributiei binomiale [The Doctrine of Chance: or The Method of Calculating the Probability of Events in Play, prima editie in Latina (Philosophical Transactions, Royal Society, London, England, 1711), a doua editie in Engleza (W. Pearforn, 1738)] - lucrare ce contine de la pagina 235 la pagina 243 lucrarea intitulata Approximatio ad Summam Terminorum Binomii (a + b)^n in Seriem expansi, prezentata anterior in anul 1733 intr-un cerc privat de prieteni.
► [distributia Gauss] Prin lucrarea [Theoria combinations observationum erroribus minnimis obnoxiae, Comm. Soc. Reg. Scient., Got. Rec. Bd. V, IV, S. 1-53, 1823] Johann Carl Friedrich GAUSS [1777-1855] pune bazele statistice ale distributiei normale, care acum ii poarta numele.
► [intervalul de incredere Wald] Abraham WALD [1902-1950, nascut in CLUJ] isi face cunoscuta contributia la studiul intervalelor de incredere, elaborand si publicand intervalul de incredere care ii poarta acum numele [Contributions to the Theory of Statistical Estimation and Testing Hypothesis, The Annals of Mathematical Statistics, p. 299-326, 1939]. O remarca deosebita se cere aici: este astazi intervalul de incredere cel mai cunoscut, si reprezinta comparatia primara in toate studiile care refera intervalele de incredere pentru distributii binomiale.
► [intervalul de incredere Wilson] Edwin Bidwell WILSON [1879-1964] este unul dintre cei mai importanti contributori la dezvoltarea cunoasterii in domeniul aproximarii distributiei binomiale prin aproximatia normala, el dezvoltand un interval de incredere care si astazi se dovedeste una dintre cele mai bune aproximari in exprimarea intervalului de incredere pentru distributia binomiala [Probable inference, the law of succession, and statistical inference, Journal of the American Statistical Association, 22, 209-212, 1927].
► [intervalul de incredere Agresti-Coull] Allan AGRESTI este cel mai faimos cercetator al intervalelor de incredere pentru distributii binomiale inca in viata. Impreuna cu intervalul Wilson, intervalul elaborat de Agresti reprezinta una dintre cele mai bune aproximari [Approximate is better than 'exact' for interval estimation of binomial proportions, The American Statistician, 52, 119-126, 1998]. Si aceasta nu e totul. In zilele noastre el este cel mai prolific cercetator al intervalelor de incredere, fiind numit in anul 2003 Statistician of the Year de catre prestigioasa American Statistical Association, iar la ceremonia de decernare a premiului (14 Octombrie 2003), Agresti a vorbit despre Binomial Confidence Intervals.
Origini si Relevanta
► Distributia binomiala isi are originile in studiul fenomenelor naturale.
► Demonstrativ in acest sens, lucrarea [Engel W. Onset of synthesis of mitochondrial enzymes during mouse development. Synchronous activation of parental alleles at the gene locus for the M form of NADP dependent malate dehydrogenase, HumanGenetik, 1973, 20(2), 133-140] dovedeste existenta distributiei binomiale la benzile heterometrice ale enzimei tetramerice, lucrarea [Meadows DL, Schultz JS. A molecular model for singlet/singlet energy transfer of monovalent ligand/receptor interactions. Biotechnology and Bioengineering 1991 37(11):1066-1075] la stoechiometria cromoforilor donori si acceptori implicati in interactiile enzimatice ligand-receptor, lucrarea [Szczelkun MD. Kinetic models of translocation, head-on collision, and DNA cleavage by type I restriction endonucleases. Biochemistry 2002 41(6):2067-2074] la translo­cation si exfolierea endonucleazelor de restrictie de tip I, lucrarea [Tanyalcin T, Eyskens F, Philips E, Lefevere M, Buyukgebiz B. A marked di?erence between two populations under mass screening of neonatal TSH and biotinidase activity. Accreditation and Quality Assurance 2002 7(11):498-506] la activitatea biotinidazei asupra hormonului stimulator tiroidian neonatal, lucrarea [Osset EA, Fernandez M, Raga JA, Kostadinov A, Mediterranean Diplodus annularis (Teleostei: Sparidae) and its brain parasite: Unforeseen outcome. Parasitology International 2005 54(3):201-206] asupra mortalitatii induse de paraziti la pesti, si lucrarea [Conant CR, Van Gilst MR, Weitzel SE, Rees WA, von Hippel PH, A Quantitative Description of the Binding States and In Vitro Function of Antitermination Protein N of Bacteriophage? Journal of Molecular Biology 2005 348(5):1039-1057] asupra ocupantei si/sau activitatii proteinelor pe locatii multiple nespecifice continand replicare.
► Lucrarea [Carlton MA, Stansfield WD. Making babies by the flip of a coin? American Statistician, 2005 59(2):180-182] defineste foarte bine cadrul si limitele modelului distributiei binomiale aplicat la fenomenele naturale.
O Definitie Formala
► Un interval de incredere da un domeniu de valori estimat care este probabil sa includa un parametru de populatie necunoscut, domeniul estimat fiind calculat dintr-un set de masuratori.
► Daca masuratorile independente sunt luate repetat din populatie, si un interval de incredere (notat CI - de la Confidence Interval) pentru fiecare masuratoare este calculat, atunci un anumit procent (notat CL - de la Confidence Level) din masuratorile parametrului necunoscut al populatiei vor fi incluse in acest (CI) interval.
► CI este cel mai frecvent calculat pentru 95% CL.
Motivatia Cercetarii
► In stiintele experimentale, in mod uzual cercetatorul ia o proba de un volum dat din intreaga populatie pentru a-si testa ipotezele. Astfel, cercetatorul opereaza cu o variabila discreta X, care colecteaza proprietatea de interes din intreaga proba de volum N. Ipoteza statistica pentru aceasta variabila (X) este ca ea este binomial distribuita.
► Estimarea intervalului de incredere (CIE - de la Confidence Intervals Estimations) pentru proportii (X/N) utilizand aproximatia la normalitate (aproximarea distributiei binomiale cu una normala) este cel mai frecvent folosita dintr-un motiv usor de inteles: aproximatia la normalitate este mult mai usor de utilizat in practica comparativ cu alti estimatori de aproximare [Pawlikowski DC, McNickle GE, Coverage of Con?dence Intervals in Sequential Steady-State Simulation. Simul Pract Theor, 1998 6:255-267]. Si mai mult decat atat, distributia normala este o functie continua, mult mai usor de insumat (integrat) numeric.
► Exprimarea adevaratelor intervale de incredere (nu cele aproximate) este insa o problema de viata si de moarte. Folosind o exprimare grosiera, sa spunem doar ca in medicina cu 1% se poate omora 1 pacient.
Scopul Cercetarii
► Obtinerea capetelor intervalelor de incredere optimizate pentru N < 1001, bazat pe o metoda originala de dubla triangulatie.
► Evaluarea performantelor intervalelor de incredere optimizate prin comparatie cu metodele cunoscute de exprimare a intervalelor de incredere.
► Aplicarea metodei in exprimarea intervalelor de incredere pentru fenomene ale caror observabile urmeaza distributia binomiala.
Baza Stiintifica a Studiului
► Problematica CIE pentru probe distribuite binomial si pentru proportia binomiala au constituit un studiu prealabil, doua lucrari reprezentative fiind selectate in acest sens:
Borkowf CB. Constructing binomial confidence intervals with near nominal coverage by adding a single imaginary failure or success. Stat Med 2006 25(21):3679-3695
Reiczigel J. Confidence intervals for the binomial parameter: some new considerations. Stat Med 2003 22(4):611-621
► Alte doua lucrari sunt reprezentative pentru analiza sistematica a problemelor care apar utilizand metode cu formula exacta:
Newcombe RG. Two-sided confidence intervals for the single proportion; comparison of several methods. Stat Med 1998 17:857-872
Brown DL, Cai TT, DasGupta A. Interval estimation for a binomial proportion. Stat Sci 2001 16:101-133
► Iata cateva dintre aceste probleme, asa cum reies din studiile de specialitate:
  • Pentru proportii mici: marginea inferioara a intervalului de incredere este obtinuta frecvent <0. Comentariu: Pe langa faptul greu de admis ca aceasta se situeaza in afara domeniului de valori posibil pentru o proportie (si/sau extragere intamplatoare), este si un nonsens fizic (este ca si cum am pune in loc sa luam bile din sac).
  • Pentru proportii mari: marginea superioara a intervalului de incredere este obtinuta frecvent >1. Comentariu: Pe langa faptul greu de admis ca aceasta se situeaza in afara domeniului de valori posibil pentru o proportie (si/sau extragere intamplatoare), este si un nonsens fizic (este ca si cum am avea mai multe bile in sac decat am bagat).
  • Daca situatiile de mai sus se intalnesc doar la anumite metode si in anumite situatii, urmatoarea este o problema comuna a tuturor metodelor cu formula exacta de calcul: acoperire inadecvata si intervale nepotrivite.
  • O singura metoda se diferentiaza de toate celelalte, si anume metoda propusa de Blyth, ulterior corectata si acum disponibila intr-o aplicatie software (StatSoft Statistica, incepand cu v.7 upd. 2006) si cunoscuta sub numele Blyth-Still-Casella [Blyth C.R., Still H.A. Binomial confidence intervals, Journal of the American Statistical Association, 78, 108-116, 1983; Blyth C.R., Approximate Binomial Confidence Limits, Journal of the American Statistical Association, 81, 843-855, 1986; Casella G., Moreno, E., Intrinsic meta-analysis of contingency tables, Statistics in Medicine, 24(4), 583-604, 2005].
  • Metoda propusa se diferentiaza insa de metoda Blyth-Still-Casella, al carui obiectiv a constituit obtinerea intervalelor de incredere cu probabilitate mai mica sau egala cu nivelul de semnificatie impus.
    ► Rezultatele studiilor preliminare ale colectivului de cercetare au aratat ca o mai buna performanta se obtine optimizand diferenta intre nivelul de semnificatie impus (teoretic) si nivelul de semnificatie obtinut/observat (experimental), aceasta constituind deci si principalul scop al cercetarii propuse:
    Drugan T, Bolboaca SD, Jäntschi L, Achimas Cadariu BA. Binomial Distribution Sample Confidence Intervals Estimation 1. Sampling and Medical Key Parameters Calculation. Leonardo Electronic Journal of Practices and Technologies 2003 2(3):45-74
    Bolboaca SD, Achimas Cadariu BA. Binomial Distribution Sample Confidence Intervals Estimation 2. Proportion-like Medical Key Parameters, Leonardo Electronic Journal of Practices and Technologies 2003 2(3):75-110
    Algoritmul de Optimizare
    ► Un algoritm inductiv a fost creat pentru a rezolva CIE pentru proportiile binomiale.
    ► Procedura de optimizare utilizeaza doua triangulatii, variind simultan 2 perechi a cate 3 capete de interval.
    ► Pentru un volum de esantion dat (N) programul foloseste 34 de puncte de start (fiecare punct de start fiind reprezentat de valorile calculate de cate o metoda de calcul exact - 17 metode - prin rotunjirea multiplului de N si respectiv trunchierea acestuia. 16 dintre medode sunt din literatura de specialitate, a 17-a fiind productie proprie a autorilor propunerii.
    ► Procedura de optimizare face schimbari la una sau mai multe necunoscute (de la 1 la 6) din cele in numar de N daca calea obtinuta produce descresterea valorii functiei cumulative de eroare.
    ► Problematica convergentei metodei a fost cea mai complexa dintre toate problematicile ridicate in rezolvarea scopului propus. Aceasta a fost rezolvata alegand cele 34 de puncte de start, care asigura impreuna totdeauna o vecinatate convenabila a solutiei optimizarii, in acelasi timp cu alegerea unei expresii a functiei de optimizare de depinde de puterea a 8-a a diferentei intre eroarea experimentala si eroarea teoretica, care s-a dovedit singura capabila sa ofere stabilitate in convergenta pentru valori mari ale volumului esantionului N (N>100).
    ► In mod evident pentru ca metoda foloseste o dubla tripla variabilitate, s-au putut optimiza cu ajutorul acesteia doar capetele de interval de incredere pentru N>6. Pentru N<7 numarul redus de posibilitati (care si aici a fost redus printr-un algoritm genetic de la 7^7 la 2^7) a permis obtinerea solutiei printr-o analiza factoriala completa. Rezultatele astfel obtinute, in termeni de capete ale intervalelor de incredere pentru 1< N < 1001 au fost obtinute si comparate cu metodele exacte.
    ► In mod evident performantele obtinute ale metodei propuse sunt superioare acestora (acestea fiind toate puncte de start in optimizare). Ce este insa de remarcat este altceva: metoda imbunatateste in medie cu 10% performantele metodelor anterioare (situandu-se pentru valori mari ale lui N (>100) peste oricare din acestea cu cel putin 10%), procent de imbunatatire care a fost observat pastrandu-se si la limita (valorile N apropiate de 1000).
    ► Nici implementarea algoritmului, nici asigurarea convergentei, nici executia si nici stocarea nu au fost activitati simple. Daca despre algoritm si convergenta s-a discutat mai sus, despre program se poate spune ca s-a pornit de la o implementare PHP, care rapid insa s-a dovedit mult prea lenta, s-au rescris programele in Borland Delphi 6, dar si aici resursele compilatorului nu au permis folosirea avantajelor oferite de procesoarele P2, P3 si mai ales P4, si s-a adaptat din nou programul pentru mediul FreePascal, mediu dedicat multiplatforma si multiarhitectura, care a permis utilizarea avantajelor de viteza si adresare ale P4.
    ► Dupa ce s-a depasit problema de executie, problema de stocare a devenit majora odata cu cresterea volumului esantionului N (>500). Numarul mare de elemente in sirul punctelor de start si in sirul destinatie a optimizarii au creat probleme de manipulare a datelor, deoarece marea majoritate a editoarelor de text obisnuite trunchiaza liniile sau adauga terminatori de linie de la sine in momentul deschiderii acestor fisiere. Si aici problema si-a gasit o solutie, trecandu-se la stocarea in sistem hexazecimal (baza 16) in locul sistemului zecimal (baza 10) uzual folosit, si au fost astfel implementate rutine de conversie intre aceste 2 baze de numeratie.
    ► O remarca se cere aici: nici in prezent manipularea acestor fisiere nu este o solutie (datele de intrare pentru 800 < N < 901 sunt stocate intr-un fisier text cu peste 10Mb; rezultatele complete ale optimizarii pentru 1 < N < 1001 sunt in 3 fisiere text cu peste 8Mb in total), fiind necesare astfel si au fost implementate rutine automate pentru citirea acestor fisiere, prelucrarea acestora si exprimarea intervalelor de incredere pe baza seriilor de numere stocate in ele (nota bene: pentru un volum de esantion egal cu N sunt stocate N numere, numarul total al capetelor intervalelor de incredere este de 2N+2). Si sunt stocate numere intregi, in timp ce intervalele de incredere pentru proportii sunt numere intregi nenegative subunitare sau unitare. Cum se ajunge de la numere intregi stocate la intervalele de incredere? - este unul dintre cele mai simple "secrete" ale metodei, si estimam ca orice statistician care isi propune acelasi sau similar scop cu acesta va ajunge la aceeasi concluzie. Oricum este dat un exemplu de conversie mai jos in text.
    ► Urmatorul tabel ilustreaza alegerea capetelor intervalului de incredere pentru N=7 (tabelul contine erorile experimentale observate utilizand metoda OptB - intervale de incredere Optimizate pentru distributia Binomiala - de exprimare a capetelor intervalelor de incredere):
    OptB 0 1 2 3 4 5 6 7
    X=0 100 0 0 0 0 0 0 0
    X=1 33.99 39.66 19.83 5.51 0.92 0.09 0.01 0
    X=2 9.49 26.56 31.87 21.25 8.5 2.04 0.27 0.02
    X=3 1.99 10.44 23.5 29.38 22.03 9.91 2.48 0.27
    X=4 0.27 2.48 9.91 22.03 29.38 23.5 10.44 1.99
    X=5 0.02 0.27 2.04 8.5 21.25 31.87 26.56 9.49
    X=6 0 0.01 0.09 0.92 5.51 19.83 39.66 33.99
    X=7 0 0 0 0 0 0 0 100
    Procedura de Evaluare
    ► Au fost propuse 5 metode de evaluare:
    Bolboaca SD, Jäntschi L. Binomial Distribution Sample Confidence Intervals Estimation for Positive and Negative Likelihood Ratio Medical Key Parameters. Annual Symposium on Biomedical and Health Informatics. American Informatics Medical Association, Special Issue: from Foundations, to Applications to Policy, Bethseda MD USA, 66-70, 2005, PubMed/MedLine.
    care ulterior au fost extinse la 12:
    Bolboaca SD, Jäntschi L. Optimized Confidence Intervals for Binomial Distributed Samples, International Journal of Pure and Applied Mathematics, 40, XXX-YYY, 2007 (in press), MathRev/ZBlath.
    ► Notatiile din aceste formule sunt:
  • M - metoda de calcul a CIE;
  • N - volumul esantionului;
  • εM - eroarea experimentala observata utilizand metoda M;
  • α - nivelul de semnificatie (eroarea teoretica) impus (uzual 5%);
  • Variabile in expresiile metodelor de evaluare sunt atat M cat si N;
  • A (variabila folosita ca literal) admite 2 valori (variabila binara): 0 si 1, pentru fiecare concretizare a valorii lui A rezultand cate o metoda de evaluare.
    ► Tabelul urmator reda valorile ideale (nota bene: niciodata atinse de nici o metoda) pentru aceste expresii de evaluare ale metodelor de calcul al intervalului de incredere pentru proportia binomiala:
    Metoda   Metoda
    AvgOE0α AvgOE1α
    StDOE00 StDOE10
    SiDOE00 SiDOE10
    AvADA00 AvADA10
    AvADS00 AvADS10
    S8DOE00 S8DOE10
    ► Urmatorul tabel contine rezultatele evaluarii metodei OptB comparativ cu celelalte metode folosind cele 12 criterii de comparatie pentru N=20 si α = 5%.
    ► Urmatorul tabel contine rezultatele evaluarii metodei OptB comparativ cu celelalte metode folosind cele 12 criterii de comparatie pentru N=200 si α = 5%.
    ► Un alt "secret" al metodei este "Cum se asigura convergenta?" - si raspunsul este folosind una dintre metodele de evaluare de mai sus drept functie cumulativa de eroare - si cel mai important rezultat este ca nu numai ca asigura convergenta in optimizare, insa rezultatele obtinute ale functiei cumulative de eroare pentru punctul de optim in functie de volumul esantionului N dau o functie monotona descrescatoare, atingand aici una din conditiile impuse pentru o serie de estimare sa fie o corecta asociere probabilistica, asa cum postuleaza numeroase studii de fundamente de statistica.
    Numerele Magice
    ► Tabelul urmator reda seria numerelor magice (rezultate in urma optimizarii) pentru volumul esantionului N=20:
    i012345678910111213141516171819
    00112234556789101112141517
    ► Remarca: Numerele (seriei de numere magice din tabelul de mai sus) sunt monoton crescatoare (si din nou se puncteaza, aici s-a respectat o alta conditie impusa pentru o serie de estimare ca sa fie o corecta asociere probabilistica, asa cum postuleaza numeroase studii de fundamente de statistica).
    ► Urmatoarele sunt formulele de conversie la intervale de incredere pentru variabila binomiala X:
  • CILower(0,N) = 0; CIUpper(N,N) = N;
  • CILower(N-i+1) = ₪(N-i) + eps., i = 1..N;
  • CIUpper(i-1) = N - ₪(N-i+1), i = 1..N;
  • eps.< 1/N;
    ► Urmatorul tabel reda valorile erorii experimentale folosind capetele intervalelor de incredere calculate cu valorile si formulele de mai sus (N fiind par eroarea este identica pentru valoarea X si pentru valoarea N-X, si astfel sunt grupate impreuna pe prima linie din tabel):
    X0,201,192,183,174,165,156,147,138,129,1110
    ε0.007.554.326.074.376.525.263.173.704.034.14
    ► Urmatorul tabel contine graficele generate online de aplicatia realizata (pentru acelasi N=20):
      ci   er  
    0.0 0%
    0.5 5%
    1.0 10%
      0.0 0.5 1.0 0 10 20  
    Rezultate
    Legenda:
    ► ISI - publicatie indexata de Thompson Scientific (Philadelphia USA)
    ► BDI - publicatie indexata intr-o baza de date internationala
    ► BDI-11 - publicatie indexata in 11 baze de date internationale
    NrTipPublicatieDetalii
    1BDI Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Andrei ACHIMAS CADARIU, Relational Information in Medicine: A Challenge, Roentgenologia & Radiologia, Bulgarian Association of Radiology, ISSN 0486-400X, Sofia, Bulgaria, XLIV(1), p. 22-25, 2005. http://lori.academicdirect.org/works/?id=43
    2BDI Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Andrei ACHIMAS CADARIU, Relational Information in Medicine: A Challenge, Roentgenologia & Radiologia, Bulgarian Association of Radiology, ISSN 0486-400X, Sofia, Bulgaria, XLIV(1), p. 22-25, 2005. http://lori.academicdirect.org/works/?id=43
    3BDI Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Carmencita DENES, Andrei ACHIMAS CADARIU, Skeletal Maturity Assessment Client-Server Application, Roentgenologia & Radiologia, Bulgarian Association of Radiology, ISSN 0486-400X, Sofia, Bulgaria, XLIV(3), p. 183-193, 2005. http://lori.academicdirect.org/works/?id=44
    4BDI Delia Maria GLIGOR, Lorentz JÄNTSCHI, Periodic System of Elements Database and Its Applications, Oradea University Annals, Chemistry Fascicle, Oradea Univeristy Press, ISSN 1224-7626, Oradea, Romania, 12, p. 180-194, 2005. http://lori.academicdirect.org/works/?id=49
    5BDI Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Binomial Distribution Sample Confidence Intervals Estimation for Positive and Negative Likelihood Ratio Medical Key Parameters, Annual Symposium on Biomedical and Health Informatics [Special Issue: from Foundations to Applications to Policy (Proc. CD, October 22-26, Washington D.C., USA)], American Medical Informatics Association, Bethesda, Maryland, USA, ISSN 1559-4076, Washington D.C., USA, #CD, p. 66-70, 2005. http://lori.academicdirect.org/works/?id=51
    6N/A Sorana Daniela BOLBOACA, Andrei ACHIMAS CADARIU, Lorentz JÄNTSCHI, Evidence-Based Guidelines Assisted Creation through Interactive Online Environment, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania, 17(3-4), p. 3-11, 2005. http://lori.academicdirect.org/works/?id=52
    7N/A Lorentz JÄNTSCHI, Mihaela Ligia UNGURESAN, Sorana Daniela BOLBOACA, Complex Structural Information Integration: Inhibitor Activity on Carbonic Anhydrase II of Substituted Disulfonamides, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania, 17(3-4), p. 12-21, 2005. http://lori.academicdirect.org/works/?id=53
    8Carte Lorentz JÄNTSCHI, Microbiology and Toxicology and Phytochemistry Studies (in Romanian), AcademicDirect, , ISBN 973-86211-8-6, www, Internet, 75 p., 2005. http://lori.academicdirect.org/works/?id=116
    9CNCSIS B+ Sorana BOLBOACA, Claudia FILIP, Stefan TIGAN, Lorentz JÄNTSCHI, Antioxidant Efficacy of 3-Indolyl Derivates by Complex Information Integration, Clujul Medical, Editura Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXIX(2), p. 204-209, 2006. http://lori.academicdirect.org/works/?id=57
    10BDI-11 Sorana BOLBOACA, Lorentz JÄNTSCHI, Pearson Versus Spearman, Kendall's Tau Correlation Analysis on Structure-Activity Relationships of Biologic Active Compounds, Leonardo Journal of Sciences, AcademicDirect, ISSN 1583-0233, www, Internet, 5(9), p. 179-200, 2006. http://lori.academicdirect.org/works/?id=58
    11N/A Lorentz JÄNTSCHI, Sorana BOLBOACA, Auto-calibrated Online Evaluation: Database Design and Implementation, Leonardo Electronic Journal of Practices and Technologies, AcademicDirect, ISSN 1583-1078, www, Internet, 5(9), p.179-192, 2006. http://lori.academicdirect.org/works/?id=59
    12BDI Lorentz JÄNTSCHI, Sorana BOLBOACA, Modelling the Inhibitory Activity on Carbonic Anhydrase IV of Substituted Thiadiazole- and Thiadiazoline- Disulfonamides: Integration of Structure Information, Electronic Journal of Biomedicine, Red UniNet Spain, ISSN 1697-090X, www, Internet, 2006(2), p. 22-33, 2006. http://lori.academicdirect.org/works/?id=60
    13N/A Lorentz JÄNTSCHI, Sorana-Daniela BOLBOACA, Modeling the Octanol-Water Partition Coefficient of Substituted Phenols: the Use of Structure Information, Third Humboldt Conference on Computational Chemistry, InnosLab Ltd. , ISBN 954-323-199-0 & 978-954-323-199-7, Varna, Bulgaria, p. 65, June 24-28, 2006. http://lori.academicdirect.org/works/?id=87
    14N/A Carmen Elena STOENOIU, Lorentz JÄNTSCHI, Sorana Daniela BOLBOACA, Computer-Based Testing in Physical Chemistry Topic, Third Humboldt Conference on Computational Chemistry, InnosLab Ltd. , ISBN 954-323-199-0 & 978-954-323-199-7, Varna, Bulgaria, p. 94, June 24-28, 2006. http://lori.academicdirect.org/works/?id=88
    15BDI Sorana BOLBOACA, Lorentz JÄNTSCHI, Computer-Assisted Training and Evaluation System in Evidence-Based Medicine, 11th International Symposium for Health Information Management Research, Dalhousie University, ISBN 0-7703-9016-1, Halifax, Nova Scotia, Canada, p. 220-226, July 14-16, 2006. http://lori.academicdirect.org/works/?id=89
    16BDI Lorentz JÄNTSCHI, Sorana BOLBOACA, Organizing Guidelines Models and Clinical Practice Guidelines, 11th International Symposium for Health Information Management Research, Dalhousie University, ISBN 0-7703-9016-1, Halifax, Nova Scotia, Canada, p. 328-338, July 14-16, 2006. http://lori.academicdirect.org/works/?id=90
    17N/A Lorentz JÄNTSCHI, Sorana Daniela BOLBOACA, Computer Aided System for Student's Knowledge Assessment, 10th World Multi-Conference on Systemics, Cybernetics and Informatics, International Institute of Informatics and Systemics, ISBN 980-6560-65-5 & ISBN 980-6560-65-3, Orlando, Florida, USA, 1, p. 97-101, July 16-19, 2006. http://lori.academicdirect.org/works/?id=91
    18N/A Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Assessment of an Computer Based Curriculum in Evidence-Based Medicine, 10th World Multi-Conference on Systemics, Cybernetics and Informatics, International Institute of Informatics and Systemics, ISBN 980-6560-65-5 &e980-6560-92-2, Orlando, Florida, USA, eKCC #3, July 16-19, 2006. http://lori.academicdirect.org/works/?id=92
    19BDI Stefan TIGAN, Lorentz JÄNTSCHI, Sorana-Daniela BOLBOACA, Modeling Herbicidal Activity of a Substituted Triazines Class by Integration of Compounds Complex Structural Information, XXIII International Biometric Conference, International Biometric Society, N/A, Montreal, Quebec, Canada, TP1.219 (509.pdf on CD), July 16-21, 2006. http://lori.academicdirect.org/works/?id=93
    20BDI Lorentz JÄNTSCHI, Sorana-Daniela BOLBOACA, Interactive Web Application for Evidence-Based Medicine Training, 11th World Congress on Internet in Medicine, Society for the Internet in Medicine, ISBN 1-897041-50-0, Toronto, Canada, p. 63, October 14-19, 2006. http://lori.academicdirect.org/works/?id=97
    21N/A Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Activity Characterization of Triazines Analogues: Statistical Parameters for Models Assessment, International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN 954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 48-49 [Plenary oral presentation], December 9-12, 2006. http://lori.academicdirect.org/works/?id=99
    22N/A Carmen Elena STOENOIU, Lorentz JÄNTSCHI, Information Theory and Others for Steroids Separation, International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN 954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 89, December 9-12, 2006. http://lori.academicdirect.org/works/?id=100
    23Carte Horea Iustin NASCU, Lorentz JÄNTSCHI, Instrumental and Analytical Chemistry (in Romanian), AcademicDirect & AcademicPres, , ISBN 973-86211-4-3 & 978-973-86211-4-5 (AcademicDirect) && ISBN 973-744-046-3 & 978-973-744-046-4 (AcademicPres), www & Cluj-Napoca, Internet & Romania, 320 p., 2006. http://lori.academicdirect.org/works/?id=119
    24BDI Lorentz JÄNTSCHI, Carmen Elena STOENOIU, Sorana Daniela BOLBOACA, Undergraduate Students Assessment on Materials Chemistry Topic using an Auto-Calibrated Online System, International Joint Conferences on Computer, Information, and Systems Sciences, and Engineering (CIS2E06), Springer, ISBN 978-1-4020-6265-0, www, Internet, EIAE #6, December 4-14, 2006. http://lori.academicdirect.org/works/?id=98
    25N/A Sorana-Daniela BOLBOACA, Lorentz JÄNTSCHI, Computer-based testing on physical chemistry topic: A case study, International Journal of Education and Development using Information and Communication Technology, The University of the West Indies, Barbados, ISSN 1814-0556, www, Internet, id=242, 3(1), 2007. http://lori.academicdirect.org/works/?id=122
    26N/A Carmen Elena STOENOIU, Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Characterization of Marine Sediments Toxicity based on Structural Information, Institute of General and Inorganic Chemistry, Bulgarian Academy of Sciences [http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv, Bulgaria, p. 54, April 19-21, 2007. http://lori.academicdirect.org/works/?id=123
    27N/A Sorana Daniela BOLBOACA, Lorentz JÄNTSCHI, Modeling the Property of Compounds from Structure: Statistical Methods for Models Validation, Institute of General and Inorganic Chemistry, Bulgarian Academy of Sciences [http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv, Bulgaria, p. 71, April 19-21, 2007. http://lori.academicdirect.org/works/?id=124
    28N/A Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Data Mining on Structure-Activity/Property Relationships Models, ECCC11- The 11th Electronic Computational Chemistry Conference, online, Monmouth University, New Jersey, USA, N/A, www, Internet, paper #29, April 2-30, 2007. http://lori.academicdirect.org/works/?id=126
    29ISI Lorentz JÄNTSCHI, Sorana-Daniela BOLBOACA, Modeling the Octanol-Water Partition Coefficient of Substituted Phenols by the Use of Structure Information, International Journal of Quantum Chemistry, Wiley InterScience, ISSN 0020-7608, eISSN 1097-461X, New York, NY, USA, Volume 107, Issue 8 (Special Issue: Proceedings from the 3rd Humboldt Conference on Computational Chemistry . Issue Edited by Georgi N. Vayssilov, Tzonka Mineva), p. 1736-1744, 2007. http://lori.academicdirect.org/works/?id=127
    30BDI-11 Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Communication of Results on Risk Factors Studies: Confidence Intervals, Leonardo Journal of Sciences, AcademicDirect, ISSN 1583-0233, www, Internet, 6(10), p. 179-187, 2007. http://lori.academicdirect.org/works/?id=129
    31BDI-11 Lorentz JÄNTSCHI, Sorana D. BOLBOACA, The Jungle of Linear Regression Revisited, Leonardo Electronic Journal of Practices and Technologies, AcademicDirect, ISSN 1583-1078, www, Internet, 6(10), p. 169-187, 2007. http://lori.academicdirect.org/works/?id=130
    32BDI Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Modelling the Inhibitory Activity on Carbonic Anhydrase I of Some Substituted Thiadiazoleand Thiadiazoline-Disulfonamides: Integration of Structure Information, Computer-Aided Chemical Engineering, Elsevier Netherlands & UK, eISSN 1570-7946, Amsterdam, Netherlands, 24(2007), p. 965-970, 2007. http://lori.academicdirect.org/works/?id=133
    33CNCSIS B+ Lorentz JÄNTSCHI, Sorana D. BOLBOACA, Antiallergic Activity of Substituted Benzamides: Characterization, Estimation and Prediction, Clujul Medical, Editura Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXX(1), p. 125-132, 2007. http://lori.academicdirect.org/works/?id=137
    34N/A Lorentz JÄNTSCHI, Carmen E. STOENOIU, Sorana D. BOLBOACA, Research Policy via Funding Allocation Analysis, The International Management Education Conference 2007 Proceedings, Faculty of Business and Economics, University Pendidikan Sultan Idris, ISBN 978-983-3759-19-4, Penang, Malaysia, paper #10§03 (7 pages), 2007. http://lori.academicdirect.org/works/?id=140
    35N/A Carmen E. STOENOIU, Lorentz JÄNTSCHI, Ioan ABRUDAN, Sorana D. BOLBOACA, Romanian Higher Education: Modelling Evolution Tendencies, The International Management Education Conference 2007 Proceedings, Faculty of Business and Economics, University Pendidikan Sultan Idris, ISBN 978-983-3759-19-4, Penang, Malaysia, paper #10§02 (6 pages), 2007. http://lori.academicdirect.org/works/?id=141
    36N/A Sorana-Daniela BOLBOACA, Lorentz JÄNTSCHI, Structure-Property Based Model Estimation of Alkanes Boiling Points, Fourth International Conference of Applied Mathematics and Computing, August 12-18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 13, from 18.30 to 19.00, Plovdiv, Bulgaria, p. 48, 2007. http://lori.academicdirect.org/works/?id=145
    37N/A Sorana-Daniela BOLBOACA, Lorentz JÄNTSCHI, Are confidence intervals for binomial distributed samples an optimization meters?, Fourth International Conference of Applied Mathematics and Computing, August 12-18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 13, from 18.00 to 18.30, Plovdiv, Bulgaria, p. 47, 2007. http://lori.academicdirect.org/works/?id=146
    38ISI Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Data Mining on Structure-Activity/Property Relationships Models, World Applied Sciences Journal, IDOSI Publications, ISSN 1818-4952, www, Internet & Faisalabad, Pakistan, 2(4), p. 323-332, 2007. http://lori.academicdirect.org/works/?id=147
    39BDI Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Amino Acids Sequences Analysis on Collagen, Bulletin of University of Agricultural Sciences and Veterinary Medicine - Animal Sciences and Biotechnologies, AcademicPres, ISSN 1843-5262, eISSN 1843-536X, Cluj-Napoca, Romania, 63-64, p. 311-316, 2007. http://lori.academicdirect.org/works/?id=158
    40BDI Carmen E. STOENOIU, Ioan ABRUDAN, Lorentz JÄNTSCHI, Time Series of Agricultural Sciences Higher Education in Romania, Bulletin of University of Agricultural Sciences and Veterinary Medicine - Horticulture, AcademicPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 64(1-2), p. 543-547, 2007. http://lori.academicdirect.org/works/?id=157
    41BDI Dan ILINA, Monica Palaghia FODOR, Lorentz JÄNTSCHI, The Control of the Infrastructure of the Rural Water Wells in the Plain Area, Bulletin of University of Agricultural Sciences and Veterinary Medicine - Horticulture, AcademicPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 64(1-2), p. 628-633, 2007. http://lori.academicdirect.org/works/?id=156
    42BDI Lorentz JÄNTSCHI, Sorana D. BOLBOACA, Carmen E. STOENOIU, National Trends on Agricultural Crops Production: Cluster Analysis, Bulletin of University of Agricultural Sciences and Veterinary Medicine - Agriculture, AcademicPres, ISSN 1843-5246, eISSN 1843-5386, Cluj-Napoca, Romania, 63-64, p. 194-202, 2007. http://lori.academicdirect.org/works/?id=155
    43ISI Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Mapping Cigarettes Similarities using Cluster Analysis Methods, International Journal of Environmental Research and Public Health, 4(3), 233-242, 2007, Published Online. http://mdpi.org/ijerph/papers/ijerph2007030007.pdf
    44BDI Sorana D. BOLBOACA, Lorentz JÄNTSCHI, Virtual Environment for Continuing Medical Education, Electron J Biomed, Link, May 13, 2007, Published Online. http://biomed.uninet.edu/2007/n2/bolboaca.html
    Lucrari trimise
    NrTipRevistaTitluStadiu
    45ISITurk J Earth SciCharacterization of Marine Sediments Toxicity Based on Structure InformationReview
    46ISITurk J Env Eng SciMobile Phase Optimization in Three Solvents High Performance Thin-Layer Chromatography: Methodology and EvaluationReview
    47ISIEl J BiotechToxicity Caused by Para-Substituents of Phenole on Tetrahymena Pyriformis and Structure-Activity RelationshipsReview
    48ISIChem Biol Drug DesFrom Structural Chemistry to Structural Biology through Information Science Study on CollagenAcceptata
    49ISIBMC Med EducLessons from Evidence-Based Medicine TrainingReview
    50BDIInt J Pure App MathModel Formulation & Interpretation - From Experiment to TheoryAcceptata
    51BDIInt J Pure App MathOptimized Confidence Intervals for Binomial Distributed SamplesAcceptata
    Concluzii
    ► Intervalele de incredere optimizate pentru variabile distribuite binomial si in acelasi timp pentru proportia binomiala au fost obtinute, evaluate, si valorificate prin seria de publicatii stiintifice enumerate mai sus.
    ► Chiar daca procesul de obtinere a valorilor optimizate s-a dovedit extrem de dificil (de exemplu pentru obtinerea unui singur interval de incredere pentru N > 900 pe un calculator P4-dual la ~3GHz a fost necesar un timp de executie non-stop > 3 zile, culminand cu o saptamana pentru N = 1000), cercetarea a fost finalizatat iar rezultatele obtinute fiind extrem de spectaculoase prin informatia care se afla in spatele simplelor numere.
    ► Doar o idee despre perspectivele deschise de cercetarea efectuata: se poate trece acum la un alt nivel de semnificatie in exprimarea intervalului de incredere, prin exprimarea valorii lui eps. (vezi in text) in functie de valoarea marginilor intervalului de incredere de nivel superior (N multiplicat cu 2, 3, ... 10, s.a), creaindu-se astfel oportunitatea obtinerii de intervale de incredere pentru distributia binomiala exacte (sau la limita exacte, mai exact, fiind vorba despre serii infinite de intregi in exprimarea acestora, cum e cazul la valoarea π sau e. Nota bene: este si un jurnal dedicat seriilor infinite de numere si aplicatiilor acestora in stiintele vietii: Journal of Integer Sequences [www.cs.uwaterloo.ca/journals/JIS/] si existand o enciclopedie online de serii de intregi [http://www.research.att.com/~njas/sequences/index.html].
    ► Este mai mult decat o simpla intamplare monotonia observata atat in valorile seriilor de numere ce dau capetele intervalelor de incredere, cat si in erorile experimentale ce rezulta din aplicarea metodei obtinute folosind aceste serii de numere, si amandoua acestea functionand doar la o singura functie cumulativa de eroare, si aceasta fiind exprimata cu puterea a 8-a a diferentei intre eroarea teoretica si eroarea experimentala. Admitem insa ca poate fi o legatura intre aceasta putere si numarul de variabile in optimizare (6), diferenta fiind chiar valoarea clasica folosita (2 - corespunzatoare formulei de deviatie standard).
    ► A fost descoperita astfel metoda de evaluare strict monotona (S8DOE0), fiind folosita ulterior pentru obtinerea seriilor de numere care dau capetele intervalelor de incredere. Rezultatele sunt disponibile online pentru 1 < N < 1001, asa cum s-a aratat in sectiunea rezumativa: binomial_distribution.
    ► O ultima remarca de final: desigur ca este foarte greu sa te faci inteles si sa convingi intr-un domeniu atat de abstract si cu atatea implicatii pentru practica de zi cu zi. Si este si mai greu sa faci in acelasi timp cercetare, administratie si promovare, mai ales daca intre timp esti presat si de activitatea didactica, si nu in ultimul rand cea sociala. Derularea prezentului proiect a demonstrat insa ca aceste obstacole sunt depasibile si cu siguranta pot fi depasite, aducand o semnificativa contributie in termeni de management al cercetarii si de dezvoltare a resurselor umane pentru cercetare.