Разлика между Semi Join и Bloom Join

Разлика между Semi Join и Bloom Join
Разлика между Semi Join и Bloom Join

Видео: Разлика между Semi Join и Bloom Join

Видео: Разлика между Semi Join и Bloom Join
Видео: Джоины в SQL запросах. Назначение. Разница между LEFT и INNER JOIN. Соединения таблиц / Илья Хохлов 2024, Юли
Anonim

Полу джойн срещу Блум джойн

Semi join и Bloom join са два метода на свързване, използвани при обработка на заявки за разпределени бази данни. Когато обработвате заявки в разпределени бази данни, данните трябва да се прехвърлят между бази данни, разположени в различни сайтове. Това може да е скъпа операция в зависимост от количеството данни, които трябва да бъдат прехвърлени. Следователно, когато обработвате заявки в среда на разпределена база данни, е важно да оптимизирате заявките, за да минимизирате количеството данни, прехвърляни между сайтовете. Semi join и bloom join са два метода, които могат да се използват за намаляване на количеството трансфер на данни и извършване на ефективна обработка на заявки.

Какво е полуприсъединяване?

Полусъединяването е метод, използван за ефективна обработка на заявки в среди на разпределени бази данни. Помислете за ситуация, при която база данни на служител (съдържаща информация като име на служител, номер на отдел, за който тя работи и т.н.), разположена на място 1, и база данни на отдел (съдържаща информация като номер на отдел, име на отдел, местоположение и т.н.), разположена на място 2. Например, ако искаме да получим името на служителя и името на отдела, за който тя работи (само за отделите, разположени в „Ню Йорк“), като изпълним заявка в процесор за заявки, разположен на място 3, има няколко начина, по които данните могат да се прехвърлят между трите сайта, за да се постигне тази задача. Но когато прехвърляте данни, важно е да се отбележи, че не е необходимо да се прехвърля цялата база данни между сайтовете. Само някои от атрибутите (или кортежи), които са необходими за свързването, трябва да бъдат прехвърлени между сайтовете, за да се изпълни заявката ефективно. Semi join е метод, който може да се използва за намаляване на количеството данни, изпращани между сайтовете. При полусъединяване само колоната за присъединяване се прехвърля от един сайт на друг и след това тази прехвърлена колона се използва за намаляване на размера на изпратените връзки между другите сайтове. За горния пример можете просто да прехвърлите номера на отдела и името на отдела на кортежи с местоположение=”Ню Йорк” от сайт 2 към сайт 1 и да извършите свързването на сайт 1 и да прехвърлите крайната връзка обратно към сайт 3.йени

Какво е Bloom Join?

Както споменахме по-рано, bloom join е друг метод, използван за избягване на прехвърлянето на ненужни данни между сайтове, когато се изпълняват заявки в среда на разпределена база данни. В bloom join, вместо да се прехвърля самата колона за присъединяване, компактно представяне на колоната за присъединяване се прехвърля между сайтовете. Bloom join използва филтър за разцвет, който използва битов вектор за изпълнение на заявки за членство. Първо се изгражда bloom филтър с помощта на колоната за присъединяване и се прехвърля между сайтовете и след това се извършват операциите за присъединяване.

Каква е разликата между Semi Join и Bloom Join?

Въпреки че методите за полусъединяване и bloom join се използват за минимизиране на количеството данни, прехвърляни между сайтовете при изпълнение на заявки в среда на разпределена база данни, bloom join намалява количеството данни (брой кортежи), прехвърлени в сравнение с полусъединяване чрез използване на концепцията за филтри за разцвет, които използват битов вектор за определяне на членството в набора. Следователно използването на bloom join ще бъде по-ефективно от използването на semi join.

Препоръчано: