Каква е разликата между FASTA и FASTQ

Съдържание:

Каква е разликата между FASTA и FASTQ
Каква е разликата между FASTA и FASTQ

Видео: Каква е разликата между FASTA и FASTQ

Видео: Каква е разликата между FASTA и FASTQ
Видео: ✅ Какая разница между Прокси и VPN 2024, Юли
Anonim

Ключовата разлика между FASTA и FASTQ е, че FASTA е текстово-базиран формат, който съхранява само нуклеотидни или протеинови последователности, докато FASTQ е текстово-базиран формат, който съхранява както стойности за качество на последователност, така и свързана последователност.йени

Биоинформатиката е област, която използва различен софтуер за анализиране и разбиране на биологични данни, особено когато наборът от данни е сложен и голям. Това поле съчетава биология, химия, физика, компютърни науки, информационно инженерство, математика и статистика за анализиране и интерпретиране на биологични данни. FASTA и FASTQ са два формата за представяне на последователности в областта на биоинформатиката за подравняване и анализиране на последователности. Всъщност FASTQ е файлов формат за последователност, който разширява формата FASTA с възможност за съхраняване на качеството на последователността.

Какво е FASTA?

FASTA е софтуер за подравняване на ДНК и протеинова последователност. Софтуерът FASTA използва формат FASTA. Това е текстов формат, който представлява или нуклеотидни последователности, или аминокиселинни (протеинови) последователности. Тук еднобуквените кодове представляват и двете последователности. FASTA е важен инструмент в областта на биоинформатиката и биохимията. Този формат позволява имена на последователности и коментари да предхождат последователностите.

FASTA срещу FASTQ в таблична форма
FASTA срещу FASTQ в таблична форма

Фигура 01: Последователност FASTA

Този формат произлиза от софтуера FASTA и е въведен от Дейвид Дж. Липман и Уилям Р. Пиърсън през 1985 г. Инструментът FASTA претърпя много модификации с течение на времето и последната версия се състои от програми за протеин: протеин, ДНК:ДНК, протеин:преведена ДНК (с изместване на рамката) и подредени или неподредени пептидни търсения. FASTA чете дадена нуклеотидна или аминокиселинна последователност и търси съответната база данни за последователности, като използва локално подравняване на последователности, за да намери съвпадения на подобни последователности от база данни.

Какво е FASTQ?

FASTQ е софтуер за подравняване, използван в областта на биоинформатиката, който съхранява както биологична последователност (обикновено нуклеотидна последователност), така и съответните й качествени резултати. FASTQ първоначално е разработен, за да обединява форматирана последователност на FASTA и свързаните данни за качеството от Wellcome Trust Sanger Institute. С развитието в областта на биоинформатиката, FASTQ се превърна в де факто стандарт за съхраняване на изхода на много инструменти за секвениране с висока производителност.

Форматът FASTQ използва четири различни реда на последователност. Ред 1 започва със знак @ и е последван от идентификатор на последователност (подобно на заглавния ред на FASTA). Ред 2 се състои от необработени последователни букви. В ред 3 последователността започва със знак „+“и по избор е последвана от същия идентификатор на последователност. Ред 4 кодира стойностите на качеството за последователността в ред 2 и трябва да се състои от същия брой символи като буквите в последователността.

Какви са приликите между FASTA и FASTQ?

  • FASTA и FASTQ са инструменти за подравняване.
  • Те са два формата за представяне на последователност.
  • И двете са свързани с областта на биоинформатиката.
  • Както FAST, така и FASTQ са важни инструменти за целите на съхранението и последователността.
  • FASTQ е разширение на формата FASTA с възможност за съхраняване на качеството на последователността.

Каква е разликата между FASTA и FASTQ?

FASTA е текстово-базиран формат, който съхранява само нуклеотидни или протеинови последователности, докато FASTQ е текстово-базиран формат, който съхранява както стойности за качество на последователност, така и свързана последователност. По този начин това е ключовата разлика между FASTA и FASTQ. Освен това FASTA съхранява фрагменти от последователност, след като бъде картографиран, докато FASTQ съхранява фрагменти от последователност преди картографиране. Освен това друга разлика между FASTA и FASTQ е, че FASTA се състои от един описателен ред, а FASTAQ се състои от четири реда.

Инфографиката по-долу представя разликите между FASTA и FASTQ в таблична форма за паралелно сравнение.

Обобщение – FASTA срещу FASTQ

Биоинформатиката използва различни формати на последователности като FASTA и FASTQ и т.н. FASTA съхранява фрагменти от последователности след картографиране, докато FASTQ съхранява фрагментите от последователности преди картографиране. FASTA е софтуер за подравняване на ДНК и протеинова последователност. Състои се от програми за протеин:протеин, ДНК:ДНК, протеин:преведена ДНК (с изместване на рамката) и подредени или неподредени търсения на пептиди. FASTQ е софтуер за подравняване, използван в областта на биоинформатиката и съхранява както биологична последователност (обикновено нуклеотидна последователност), така и съответните й качествени резултати. FASTA се състои от един описателен ред, а FASTQ се състои от четири реда. И така, това обобщава разликата между FASTA и FASTQ.

Препоръчано: