• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Bioinformatyka



    Podstrony: 1 [2] [3] [4] [5]
    Przeczytaj także...
    Drzewo filogenetyczne lub drzewo rodowe – graf acykliczny przedstawiający ewolucyjne zależności pomiędzy sekwencjami lub gatunkami wszystkich organizmów żywych, podobnie jak pokrewieństwo w rodzie ludzkim obrazuje drzewo genealogiczne.Representational State Transfer – wzorzec architektury oprogramowania wywiedziony z doświadczeń przy pisaniu specyfikacji protokołu HTTP. REST jest wzorcem architektury oprogramowania wprowadzającym dobre praktyki tworzenia architektury aplikacji rozproszonych.
    Podwójna helisa DNA

    Bioinformatyka – interdyscyplinarna dziedzina nauki wykorzystująca metody i narzędzia informatyczne do rozwiązywania problemów z nauk biologicznych.

    Bioinformatyka obejmuje rozwój metod obliczeniowych służących do badania struktury, funkcji i ewolucji genów, genomów i białek. Ponadto odpowiada za rozwój metod wykorzystywanych do zarządzania i analizy informacji biologicznej gromadzonej w toku badań genomicznych oraz badań prowadzonych z zastosowaniem wysokoprzepustowych technik eksperymentalnych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomika, transkryptomika i konektomika.

    Sekwencja aminokwasów, struktura pierwszorzędowa białka, struktura pierwotna białka – pierwszy poziom organizacji, na którym można opisać budowę białka. Opisuje liniowy układ aminokwasów w łańcuchu polipeptydowym zgodny z kodem genetycznym.Medycyna (łac. medicina „sztuka lekarska”) – nauka empiryczna (oparta na doświadczeniu) obejmująca całość wiedzy o zdrowiu i chorobach człowieka oraz sposobach ich zapobiegania, oraz ich leczenia. Medycyna weterynaryjna rozszerza zakres zainteresowań medycyny na stan zdrowia zwierząt. Za prekursora medycyny starożytnej uważa się Hipokratesa, a nowożytnej Paracelsusa. W czasach najnowszych wprowadza się zasady medycyny opartej na faktach.

    Spis treści

  • 1 Wstęp
  • 1.1 Historia
  • 1.2 Podstawowe zagadnienia bioinformatyki
  • 1.3 Cele
  • 1.4 Stosunek do innych dziedzin wiedzy
  • 1.4.1 Podział bioinformatyki
  • 2 Analiza sekwencji DNA
  • 2.1 Adnotacja genomu
  • 2.2 Obliczenia dotyczące relacji ewolucyjnych
  • 2.3 Porównywanie genomów
  • 2.4 Analiza mutacji nowotworowych
  • 3 Ekspresja genów i analiza białek
  • 3.1 Analiza ekspresji genów
  • 3.2 Analiza regulacji
  • 3.3 Analiza białek
  • 4 Bioinformatyka strukturalna
  • 5 Bazy danych
  • 5.1 Przykładowe bazy danych
  • 6 Oprogramowanie i narzędzia
  • 6.1 Oprogramowanie o otwartym kodzie źródłowym
  • 6.2 Usługi internetowe
  • 7 Inne
  • 7.1 Komputery DNA
  • 7.2 Kryptografia molekularna
  • 8 Przypisy
  • 9 Linki zewnętrzne
  • Biologia (z gr. βίος (bios) - życie i λόγος (logos) - słowo, nauka) – nauka przyrodnicza zajmująca się badaniem życia i organizmów żywych.Proteomika – gałąź nauki zajmująca się badaniem białek – ich struktury, sprawowanych przez nie funkcji i zależności między nimi.

    Wstęp[]

    Historia[]

    Margaret Oakley Dayhoff

    Termin „bioinformatyka” pojawił się po raz pierwszy w 1970 roku i odnosił się do badania procesów informatycznych w systemach biotycznych. Jego twórcami są Paulien Hogeweg i Ben Hesper. W ten sposób wyróżnili oni bioinformatykę jako osobną dziedzinę nauki obok biochemii i biofizyki.

    Statystyka (niem. Statistik, „badanie faktów i osób publicznych”, z łac. [now.] statisticus, „polityczny, dot. polityki”, od status, „państwo, stan”) – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.Badanie ojcostwa – postępowanie analityczne mające na celu potwierdzenie lub wykluczenie ojcostwa w linii domniemany ojciec – dziecko, wykorzystywane następnie dla celów prywatnych lub sądowych. Badanie ojcostwa obejmuje różne metody analizy pokrewieństwa, stosowane w:

    Z bioinformatyką związana jest ściśle biologia molekularna. Na rozwój tej drugiej dziedziny miały wpływ przede wszystkim dwa dokonania w latach 50 XX wieku. Pierwszym z nich było odkrycie w 1953r. przez Jamesa Watsona i Francisa Cricka struktury podwójnej helisy DNA przechowującego informację genetyczną we wszystkich organizmach żywych. Drugim było określenie przez F. Sangera w 1952r. pełnej sekwencji aminokwasów insuliny. Eksperymenty biologiczne zaczęły generować ogromne ilości danych, które okazały się trudne do przechowywania i „ręcznego” przetwarzania. Z tego powodu wykorzystanie komputerów i informatyki stało się niezbędne przy pracy biologów.

    Ekson (egzon, sekwencja kodująca) − w komórkach eukariotycznych odcinek genu (zazwyczaj krótszy od intronu), kodujący sekwencję aminokwasów w cząsteczce białka. Eksony bywają w genomie jądrowym oddzielone intronami. Pierwotny transkrypt zawiera wówczas na przemian ułożone odcinki intronowe i eksonowe. Po zsyntetyzowaniu czapeczki i poliadenylacji cząsteczki RNA, ale jeszcze przed jej eksportem z jądra do cytoplazmy następuje wycięcie wszystkich intronów oraz połączenie eksonów w jedną całość (splicing). Po zakończeniu tych procesów transkrypt staje się funkcjonalną cząsteczką informacyjnego RNA (mRNA), który w tej postaci może opuścić jądro komórkowe i zostać użytym w procesie translacji.BLAST (ang. Basic Local Alignment Search Tool) – narzędzie bioinformatyczne (algorytm) służący do lokalnego przyrównywania sekwencji aminokwasów białek lub nukleotydów DNA. BLAST umożliwia naukowcom porównywanie zadanej sekwencji z sekwencjami zawartymi w biologicznych bazach danych i ocenę ich podobieństwa.

    Pionierką w tej dziedzinie była Margaret Oakley Dayhoff – twórczyni pierwszej bioinformatycznej bazy danych, w której zgromadziła wszystkie dostępne sekwencje białkowe. Dzięki kolejnym dokonaniom, takim jak zsekwencjonowanie po raz pierwszy pełnego genomu DNA przez Fredericka Sangera, zapotrzebowanie na bioinformatykę znacznie się zwiększyło, a jej rozwój wyraźnie przyspieszył. W latach 80. XX wieku powstał GenBank, amerykańska bioinformatyczna baza danych zbierająca i gromadząca sekwencje nukleotydowe. Ponadto założono National Center for Biotechnology Information (NCBI) – organizację, która zajęła się zarządzaniem GenBankiem i Human Genome Project (HGP) – projekt naukowy, którego celem było poznanie ludzkiego genomu. W Europie powstała baza danych na Uniwersytecie w Genewie (SWISS-PROT) i European Molecular Biology Laboratory (EMBL). Dzięki dalszym badaniom i postępowi w bioinformatyce możliwe było między innymi zsekwencjonowanie w 2001r. ludzkiego genomu.

    Walter Gilbert (ur. 21 marca 1932 w Bostonie) – amerykański fizyk, chemik, biolog, laureat Nagrody Nobla w dziedzinie chemii.Gen (gr. γένος – ród, pochodzenie) – podstawowa jednostka dziedziczności determinująca powstanie jednej cząsteczki białka lub kwasu rybonukleinowego zapisana w sekwencji nukleotydów kwasu deoksyrybonukleinowego.

    Podstawowe zagadnienia bioinformatyki[]

  • katalogowanie informacji biologicznych (bazy danych, bazy danych sekwencji i wyszukiwanie sekwencji, adnotacji, danych numerycznych w bazach danych)
  • analiza sekwencji DNA (składanie sekwencji, adnotacja, wyszukiwanie sekwencji kodujących, regulatorowych i repetytywnych, motywów, markerów)
  • analiza sekwencji genomów, porównywanie genomów
  • ustalanie ewolucyjnych relacji pomiędzy zbiorami sekwencji / organizmów (drzewa filogenetyczne)
  • genotypowane (używane między innymi do wyszukiwania genów odpowiedzialnych za choroby genetyczne, w ustalaniu ojcostwa, kryminalistyce)
  • analiza ekspresji genów (głównie analiza danych z mikromacierzy)
  • analiza sekwencji białek, nazywana też proteomiką (porównywanie sekwencji, wyszukiwanie domen i motywów, przewidywanie własności fizyko-chemicznych, drugo- i trzecio-rzędowej struktury białka, lokalizacji w obrębie komórki, analiza danych z eksperymentów spektroskopowych)
  • katalogowanie funkcji genów/białek, analiza dróg metabolicznych (np metabolizm lipidów) oraz dróg sygnałowych (np od receptora na powierzchni komórki poprzez kaskadę kinaz do czynników transkrypcyjnych)
  • modelowanie molekularne
  • modelowanie układów biologicznych
  • morfometria / analiza obrazu
  • Cele[]

    Szybki rozwój genomiki i biologii molekularnej doprowadził do powstawania ogromnej ilości informacji, które były wynikami przeprowadzonych eksperymentów w tych dziedzinach. Biolodzy w swojej pracy byli zmuszeni do skorzystania z komputerów i informatyki na dwóch etapach:

    SOAP (ang.) Simple Object Access Protocol – protokół wywoływania zdalnego dostępu do obiektów, wykorzystujący XML do kodowania wywołań i najczęściej protokołów HTTP lub RPC do ich przenoszenia, możliwe jest jednak wykorzystanie innych protokołów do transportu danych.Taksonomia (gr. taksis – układ, porządek + nomos – prawo) – poddyscyplina systematyki organizmów, nauka o zasadach i metodach klasyfikowania, w szczególności o tworzeniu i opisywaniu jednostek systematycznych (taksonów) i włączaniu ich w układ kategorii taksonomicznych.
  • na etapie gromadzenia, zapisywania, przechowywania i wydobywania informacji
  • na etapie przetwarzania informacji zawartych w DNA, RNA i białkach, modelowania ich struktur przestrzennych oraz przewidywania ich funkcjonalności i wzajemnych powiązań
  • Bioinformatyka jest dziedziną wiedzy dla której biologia i związane z nią problemy są przyczyną działania, natomiast informatyka wraz z matematyką dostarczają narzędzi do ich rozwiązania. Po pierwsze pociąga to za sobą powstanie i zarządzanie zaawansowanymi bazami danych, w których mogą być przechowywane i efektywnie eksplorowane dane biologiczne. Drugą ważną częścią bioinformatyki jest aspekt obliczeniowy, czyli wykorzystanie komputerów do przetwarzania danych. Matematyka pozwala przy pomocy równań modelować pewne zjawiska, ale nie jest to wystarczające. Potrzebne są przede wszystkim efektywne algorytmy i programy komputerowe konstruujące rozwiązania. Przykładem są metody do lokalizowania genów w sekwencjach białkowych, aby przewidzieć ich strukturę i/lub funkcję i przydzielić tym samym daną sekwencję białkową do rodziny pokrewnych sekwencji.

    PMID (ang. PubMed Identifier, PubMed Unique Identifier) – unikatowy identyfikator przypisany do każdego artykułu naukowego bazy PubMed.Środowisko przyrodnicze (środowisko naturalne) – całokształt ożywionych i nieożywionych składników przyrody, ściśle ze sobą powiązanych, otaczających organizmy żywe. W jego ramach można wyróżnić następujące elementy:

    Celem bioinformatyki jest pomoc w zrozumieniu funkcjonowania mechanizmów organizmów żywych i procesów biologicznych. Jest wykorzystywana między innymi do dopasowywania sekwencji, odnajdywania genów, przewidywania struktur białek, ale również znajduje zastosowanie także w wiele pokrewnych dziedzin takich jak biotechnologia czy medycyna. Przyczynia się to między innymi do szybszego projektowania leków czy też wykonywania analiz DNA w medycynie sądowej.

    Genom – materiał genetyczny zawarty w podstawowym (haploidalnym) zespole chromosomów. Termin mylony jest z genotypem, czyli całością informacji genetycznej zawartej w chromosomach organizmu.Gatunek (łac. species, skrót sp.) – termin stosowany w biologii w różnych znaczeniach, zależnie od kontekstu, w jakim występuje. Najczęściej pod pojęciem gatunku rozumie się:

    Stosunek do innych dziedzin wiedzy[]

    Bioinformatyka jest ściśle związana z biologią obliczeniową. Podział między obiema dziedzinami przebiega na styku nauki i technologii. Biologia obliczeniowa opracowuje modele ilościowe zagadnień biologicznych bazujące na sformułowaniach matematycznych, natomiast bioinformatyka korzystając z tych modeli tworzy algorytmy dające rozwiązania. Bioinformatyka zajmuje się więc rozwijaniem narzędzi do analiz sekwencji, strukturalnych, funkcjonalnych oraz systemowych oraz narzędzi do przetwarzania informacji przechowywanych w bazach danych.

    Hybrydyzacja kwasów nukleinowych – zjawisko spontanicznego łączenia się komplementarnych nici kwasów nukleinowych (DNA z DNA, RNA z RNA lub DNA z RNA). Komplementarne nici kwasów nukleinowych ulegają rozdzieleniu (tzw. denaturacji) pod wpływem wysokiej temperatury lub substancji chemicznych, takich jak formamid lub mocznik. Po usunięciu wpływu czynnika denaturującego, nici łączą się ponownie (renaturacja). Szybkość hybrydyzacji zależy między innymi od długości fragmentów kwasów nukleinowych, podobieństwa i różnorodności sekwencji w próbce poddanej hybrydyzacji.Insulina – anaboliczny hormon peptydowy o działaniu ogólnoustrojowym, odgrywający zasadniczą rolę przede wszystkim w metabolizmie węglowodanów, lecz także białek i tłuszczów. Nazwa insulina z łac. insula - wyspa, pochodzi od wysepek Langerhansa trzustki, gdzie insulina jest produkowana.

    Podział bioinformatyki[]

  • Bioinformatyka sekwencji - porównywanie genomów, filogenetyka, przewidywanie genu, wykrywanie motywów, przeszukiwanie baz danych sekwencji, porównywanie sekwencji, sekwencjonowanie.
  • Bioinformatyka strukturalna - przewidywanie struktury kwasu nukleinowego, przewidywanie struktury białka, klasyfikacja struktury białek, porównywanie struktury białek
  • Bioinformatyka funkcjonalna - modelowanie ścieżek metabolicznych, profilowanie ekspresji genu, przewidywanie oddziaływań białka, przewidywanie lokalizacji komórkowej białka
  • Bioinformatyka systemów - analiza i modelowanie systemów biologicznych
  • W celu analizy danych biologicznych przy pomocy bioinformatyki tworzone są programy, które używają algorytmów z teorii grafów, sztucznej inteligencji czy eksploracji danych. Algorytmy są natomiast zależne od podstaw teoretycznych, takich jak matematyka dyskretna czy statystyka.

    Definicja intuicyjna: Kod źródłowy to zapis programu komputerowego w formie czytelnej dla człowieka umożliwiający jego modyfikację i rozwój.Osobnik – jednostkowy organizm, jednostkowy okaz (przedstawiciel) gatunku, żyjący samodzielnie lub w grupie, np. w stadzie bądź kolonii, stanowiący podstawowy element populacji. Ogólnie przyjęto zasadę, że cechą charakterystyczną osobnika jest oddziaływanie na inne osobniki własnego gatunku, inne organizmy oraz środowisko.


    Podstrony: 1 [2] [3] [4] [5]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Biologia molekularna – nauka podstawowa zajmująca się biologią na poziomie molekularnym. Bada, w jaki sposób funkcjonowanie organizmów żywych uwarunkowane jest właściwościami budujących je cząsteczek, a zwłaszcza biopolimerów, jakimi są kwasy nukleinowe i białka. Zazębia się ona z takimi dziedzinami wiedzy jak genetyka, biochemia, biofizyka czy cytologia.
    Francis Harry Compton Crick (ur. 8 czerwca 1916 w Northampton, zm. 28 lipca 2004 w San Diego) – angielski biochemik, genetyk i biolog molekularny, laureat Nagrody Nobla w dziedzinie fizjologii lub medycyny w roku 1962. Wraz z Jamesem D. Watsonem, Mauricem Wilkinsem i Rosalindą Franklin odkrył strukturę molekularną DNA. Pracownik naukowy Laboratorium Biologii Molekularnej na Uniwersytecie Cambridge, członek Towarzystwa Królewskiego w Londynie.
    Biologia ewolucyjna – dział biologii zajmujący się badaniem pochodzenia gatunków od wspólnych przodków, ich zmianami i różnicowaniem się w czasie. Stara się wyjaśnić przystosowania organizmów do środowiska oraz przyczyny ich zróżnicowania. Jest dziedziną interdyscyplinarną – łączy niektóre aspekty takich działów biologii jak zoologia, botanika, filogenetyka, genetyka, etologia, paleontologia czy geologia.
    Nowotwór (łac. neoplasma, skrót npl – z greckiego neoplasia) – grupa chorób, w których komórki organizmu dzielą się w sposób niekontrolowany przez organizm, a nowo powstałe komórki nowotworowe nie różnicują się w typowe komórki tkanki. Utrata kontroli nad podziałami jest związana z mutacjami genów kodujących białka uczestniczące w cyklu komórkowym: protoonkogenów i antyonkogenów. Mutacje te powodują, że komórka wcale lub niewłaściwie reaguje na sygnały z organizmu. Powstanie nowotworu złośliwego wymaga kilku mutacji, stąd długi, ale najczęściej bezobjawowy okres rozwoju choroby. U osób z rodzinną skłonnością do nowotworów część tych mutacji jest dziedziczona.
    Informatyka – dyscyplina nauki zaliczana do nauk ścisłych oraz techniki zajmująca się przetwarzaniem informacji, w tym również technologiami przetwarzania informacji oraz technologiami wytwarzania systemów przetwarzających informację. Początkowo stanowiła część matematyki, później rozwinęła się do odrębnej dyscypliny – pozostaje jednak nadal w ścisłej relacji z matematyką, która dostarcza informatyce podstaw teoretycznych.
    Struktura drugorzędowa białka – jeden z poziomów organizacji cząsteczki białka, który opisuje jej budowę. Określa się tu sposób przestrzennego ułożenia łańcuchów polipeptydowych białek na skutek powstawania wewnątrzcząsteczkowych wiązań wodorowych przede wszystkim między atomami tlenu grup amidowych i atomami wodoru innych grup amidowych. Łańcuchy polipeptydowe białek mogą układać się w kształt:
    Struktura trzeciorzędowa białka – poziom organizacji, na którym można opisać budowę białka. Określa się tu wzajemny układ w przestrzeni elementów struktury drugorzędowej, bez uwzględniania zależności od sąsiednich cząsteczek. Kształt, wielkość i właściwości danej podjednostki decydują o aktywności biochemicznej, w tym o działaniu enzymu. Warunkują ją różne wiązania chemiczne oraz oddziaływania międzycząsteczkowe np.:

    Reklama