Этот стандарт определяет синтаксис и семантику двух языков баз данных:
Язык определения схем (SQL-DLL) для объявления структур и ограничений целостности базы данных SQL.
Язык модулей и манипулирования данными (SQL-DML) для объявления процедур базы данных и выполняемых операторов в конкретной прикладной программе базы данных.
Этот стандарт определяет логические структуры данных и базовые операции для базы данных SQL. Он обеспечивает функциональные возможности для проектирования, доступа, поддержания, управления и защиты базы данных.
Этот стандарт обеспечивает средство для мобильности определений базы данных и прикладных программ между соответствующими стандарту реализациями.
Этот стандарт определяет два уровня и отдельное средство поддержания целостности. Уровень 2 - это полный язык баз данных SQL, не включающий средство поддержания целостности. Уровень 1 - это подмножество уровня 2, определенное в разделе 9 "Уровни" .
Замечание: Планируется дополнительный язык SQL как дополнение к этому стандарту. Основными темами, обсуждаемыми для этого приложения, являются улучшенное управление транзакциями, определение некоторых правил, объявляемых в конкретной реализации, улучшенные средства работы с символами и поддержка национальных наборов символов.
Средство поддержания целостности состоит в определении:
требуемых ограничений на ссылки между таблицами;
проверочных ограничений на строки таблицы;
значений столбца по умолчанию при занесении строки в таблицу.
В приложениях к стандарту определяется синтаксис включения операторов манипулирования данными SQL в стандартную во всех остальных отношениях прикладную программу. Такой синтаксис определяется как сокращенная нотация для стандартной прикладной программы, в которой встроенные операторы SQL заменены явными "вызовами" процедур базы данных, содержащими операторы SQL.
Этот стандарт применим к реализациям, существующим в среде, которая может включать прикладные языки программирования, языки запросов уровня конечного пользователя, системы генерации отчетов, системы словарей данных и распределенные коммуникационные системы, а также различные средства проектирования баз данных, администрирования баз данных и оптимизации производительности.
2. СсылкиISO 1539, Programming Languages - FORTRAN (endorsement by ISO of American National Standard X3.9).
ISO 1989, Programming Languages - COBOL (endorsement by ISO of American National Standard X3.23).
ISO 6160, Programming Languages - PL/1 (endorsement by ISO of American National Standard X3.53).
ISO 7185, Programming Languages - Pascal (endorsement by ISO of British Standard 6192 for the English text).
3. Обзор 3.1 ОрганизацияЭтот стандарт организован следующим образом:
В 3.2, "Нотация" и 3.3, "Соглашения" определяются нотации и соглашения, используемые в этом стандарте.
В 3.4, "Соответствие" определяется критерий соответствия.
В Разделе 4, "Понятия" определяются термины и представляются понятия, используемые в определении SQL.
В Разделе 5, "Общие элементы" определяются элементы языка, встречающиеся в нескольких частях языка SQL.
В Разделе 6, "Язык определения схем" определяются средства SQL для определения базы данных.
В Разделе 7, "Язык модулей" определяются модели и процедуры SQL.
В Разделе 8, "Язык манипулирования данными" определяются операторы манипулирования данными SQL.
В Разделе 9, "Уровни" определяются два уровня SQL и средство поддержания целостности.
3.2 НотацияВ качестве синтаксической нотации в этом стандарте используются БНФ ("Бэкусовские нормальные формы" или "Формы Бэкуса-Наура) со следующими расширениями:
Квадратные скобки ([]) обозначают необязательные элементы.
Многоточия (...) обозначают элементы, которые могут повторяться один или более раз.
Фигурные скобки ({ }) объединяют последовательности элементов.
В синтаксисе БНФ продукционный символ определяется как содержащий продукционный символ , если входит в расширение . Если содержит , то содержится в . Если содержит , то является "содержащим" продукционным символом для .
3.3 СоглашенияСинтаксические элементы этого стандарта определяются в следующих терминах:
Функция: короткое предложение о назначении элемента.
Формат: БНФ-определение синтаксиса элемента.
Синтаксические правила: дополнительные синтаксические ограничения, которым должен удовлетворять элемент, не выраженные в БНФ.
Общие правила: последовательная спецификация эффекта выполнения элемента.
В Синтаксических правилах термин "должен" определяет условия, которым должен удовлетворять любой вариант языка SQL, синтаксически соответствующий стандарту. Язык SQL синтаксически соответствует стандарту, если соответствует и Форматам и Синтаксическим правилам.
В Общих правилах термин "должен" определяет условия, которые проверяются во время выполнения операторов SQL. Если все эти условия истинны, то оператор выполняется успешно и в параметр SQLCODE устанавливается определенное неотрицательное число. Если какое-либо из условий ложно, оператор не выполняется успешно, не влияет на состояние базы данных, и в параметр SQLCODE устанавливается определенное реализатором отрицательное число.
В соответствующей стандарту реализации не требуется выполнение точной последовательности действий, определенных в Общих правилах, но должен достигаться тот же эффект, что и при выполнении этой последовательности. Термин "фактически" используется в Общих правилах для того, чтобы выделить действия, результат которых может быть достигнут в реализации другим способом.
Термин "долговременно хранимый объект" используется для характеризования таких объектов, как () и (), которые создаются и уничтожаются с помощью механизмов, определенных реализатором.
В этом стандарте разделы начинаются с новых страниц с нечетными номерами, и, начиная с "Общих элементов" Раздела 5 до "Языка манипулирования данными" Раздела 8 , подразделы начинаются с новой страницы. Возникающие в результате пустоты несущественны.
3.4 СоответствиеВ этом стандарте определяются соответствующие язык SQL и реализации SQL. Соответствующий стандарту язык SQL должен придерживаться Формата БНФ и соответствующих Синтаксических правил. Соответствующая реализация SQL должна обрабатывать соответствующий стандарту язык SQL в соответствии с Общими правилами.
В реализации, провозглашаемой соответствующей SQL-DDL, должен обрабатываться SQL-DDL ( ()) на уровне 1 или уровне 2.
В реализации, провозглашаемой соответствующей SQL-DML, на уровне 1 или уровне 2 должны обрабатываться:
Прямые вызовы операторов языка манипулирования данными SQL ( ()) и/или
Язык модулей ( ()) и/или
один или более из
a) COBOL со встроенным SQL (
());
b) FORTRAN со встроенным SQL ( ());
c) Pascal со встроенным SQL ( ());
d) PL/1 со встроенным SQL (
()).
В реализации, провозглашаемой полностью соответствующей SQL, должно обеспечиваться на уровне 1 или уровне 2 соответствие SQL-DDL и соответствие SQL-DML.
Соответствующие стандарту реализации могут обеспечивать дополнительные средства или возможности, не специфицируемые этим стандартом. Реализация остается соответствующей стандарту, даже если в ней обеспечиваются пользовательские опции для обработки языка, не соответствующего стандарту SQL или для обработки языка, соответствующего стандарту языка SQL, не соответствующим стандарту образом.
При провозглашении соответствия этому стандарту должно устанавливаться:
Какой из следующих типов соответствия провозглашается:
a) Полное соответствие SQL на уровне 1;
b) Полное соответствие SQL на уровне 2;
c) Cоответствие SQL-DDL на уровне 1;
d) Cоответствие SQL-DDL на уровне 2;
e) Cоответствие SQL-DML на уровне 1;
f) Cоответствие SQL-DML на уровне 2.
Какие из следующих возможностей реализованы:
a) Прямая обработка операторов языка манипулирования данными SQL;
b) Язык модулей ( ());
c) COBOL со встроенным SQ (
());
d) FORTRAN со встроенным SQL ( ());
e) Pascal со встроенным SQL ( ());
f) PL/1 со встроенным SQL (
()).
Реализовано ли средство поддержания целостности.
Этот стандарт не определяет метод или время связывания прикладных программ и компонентов системы управления базами данных.
4. Понятия 4.1 МножестваМножество есть неупорядоченный набор различных объектов.
Мультимножество есть неупорядоченный набор объектов, которые не обязательно различны.
Последовательность есть упорядоченный набор объектов, которые не обязательно различны.
Мощность набора есть число объектов в этом наборе. Если не оговорено противное, любой набор может быть пустым.
4.2 Типы данныхТип данных есть множество представимых значений. Логическое представление значения есть (). Физическое представление значения зависит от реализации.
Значение является примитивным в том смысле, что в этом стандарте не производится логическое подразделение значений. Значение может быть неопределенным значением или не неопределенным значением.
Неопределенное значение есть определяемое в реализации зависящее от типа специальное значение, отличное ото всех не неопределенных значений этого типа.
Не неопределенное значение есть либо символьная строка, либо число. Символьная строка и число - это несравнимые значения.
4.2.1 Символьные строкиСимвольная строка состоит из последовательности символов из определенного в реализации множества символов. Символьная строка обладает длиной, которая является положительным целым числом, определяющим число символов в последовательности.
Все символьные строки сравнимы. Символьная строка идентична другой символьной строке, если и только если она равна этой символьной строке в соответствии с правилами сравнения, определенными в 5.11, " ()".
4.2.2 ЧислаЧисло - это либо точное численное значение, либо приблизительное численное значение. Все числа являются сравнимыми значениями.
Каждое точное численное значение обладает точностью и масштабом. Точность - это положительное целое число, которое определяет число значащих десятичных цифр. Масштаб - это неотрицательное целое число. Масштаб 0 означает, что число является целым. При масштабе N точное численное значение есть целое значение значащих цифр, умноженное на 10 в степени N.
Приблизительные численные значения состоят из мантиссы и порядка. Мантисса - это численное значение со знаком, порядок - это целое со знаком, определяющее значимость мантиссы. Приблизительное численное значение обладает точностью. Точность это положительное целое число, определяющее число значащих двоичных цифр в мантиссе.
При присвоении точного численного значения элементу данных или параметру, представляющему точное численное значение, сохраняющее лидирующие значащие цифры приближение этого значения представляется в целевом типе данных. Значение преобразуется таким образом, чтобы получить целевые точность и масштаб.
При присвоении точного или приблизительного численного значения элементу данных или параметру, представляющим приблизительное численное значение, сохраняющее лидирующие значащие цифры приближение этого значения представляется в целевом типе данных. Значение преобразуется таким образом, чтобы получить целевую точность.
4.3 СтолбцыСтолбец есть мультимножество значений, которое может меняться во времени. Все значения одного столбца являются значениями одного типа и значениями в одной таблице. Значение столбца - минимальный элемент данных, которые могут быть выбраны из таблицы, и минимальный элемент данных, которые могут быть изменены.
Столбец имеет описание и порядковую позицию в таблице. Описание столбца включает его тип данных и указание о том, распространяется ли на столбец ограничение содержать только не неопределенные значения. Описание столбца символьных строк определяет его атрибут длины. Описание столбца приблизительных чисел определяет точность этих чисел. Описание столбца точных чисел определяет точность и масштаб этих чисел.
Именованный столбец есть столбец именованной таблицы или столбец, который наследует описание именованного столбца. Описание именованного столбца включает его имя.
4.4 ТаблицыТаблица есть мультимножество строк. Строка есть непустая последовательность значений. Все строки одной таблицы обладают одинаковой мощностью и содержат значения каждого столбца этой таблицы. I-ое значение каждой строки таблицы является значением i-ого столбца этой таблицы. Строка является минимальным элементом данных, которые можно занести в таблицу и удалить из таблицы.
Степень таблицы есть число столбцов этой таблицы. В любой момент времени степень таблицы та же, что и мощность каждой из ее строк, и мощность таблицы та же, что и мощность каждого из ее столбцов.
Таблица имеет описание. Это описание включает описание каждого из столбцов таблицы.
Базовая таблица есть именованная таблица, определенная через (). Описание базовой таблицы включает ее имя.
Порожденная таблица - это таблица, порожденная прямо или косвенно из одной или нескольких других таблиц путем вычисления (). Значениями порожденной таблицы являются значения определяющих таблиц при ее порождении.
Представляемая таблица есть именованная таблица, определенная через (). Описание представляемой таблицы включает ее имя.
Таблица является либо изменяемой (updatable), либо только читаемой. Операции занесения, модификации и удаления допускаются для изменяемых таблиц и не допускаются для только читаемых таблиц.
Сгруппированная таблица есть множество групп, порождаемых в ходе вычисления (). Группа - это мульти-множество строк, в которых все значения столбца (столбцов) группирования равны. Сгруппированную таблицу можно рассматривать как набор таблиц. Множественные функции могут применяться к индивидуальным кортежам внутри сгруппированной таблицы.
Сгруппированное представление - это представляемая таблица, порожденная из сгруппированной таблицы.
4.5 Ограничения целостностиОграничения целостности определяют допустимые значения базы данных путем ограничения значений в базовых таблицах.
Ограничения целостности фактически проверяются после выполнения каждого (). Если базовая таблица, ассоциированная с ограничением целостности, не удовлетворяет этому ограничению целостности, то () не выполняется, и в параметр SQLCODE устанавливается определенное в реализации отрицательное число.
() требует, чтобы никакие две строки в таблице не имели одинаковых значений в указанном столбце или столбцах.
Спецификация NOT NULL требует, чтобы никакие значения в столбце не были неопределенными значениями.
() требует, чтобы для каждой строки одной указанной таблицы - "ссылающейся таблицы" - значения указанного столбца или столбцов либо включали как минимум одно неопределенное значение, либо были бы такими же, как значения указанного столбца или столбцов в некоторой строке другой указанной таблицы - "ссылаемой таблицы". Ссылающаяся таблица может быть той же самой таблицей, что и ссылаемая таблица.
() требует, чтобы указанное () не было ложно ни для какой строки таблицы.
4.6 Схемы() есть долговременно хранимый объект, определенный на языке определения схем. Он состоит из () и всех (), () и (), известных системе для указанного () в среде. Понятие среды определяется в реализации.
Таблицы, представления и привилегии, определенные через (), рассматриваются как "принадлежащие" или должные быть "созданными" (), определенным для этой схемы.
Замечание: В реализации могут обеспечиваться средства (такие, как DROP TABLE, DROP VIEW, ALTER TABLE и REVOKE), которые позволяют создавать, уничтожать и модифицировать определения таблиц, представлений и привилегий для данного () в разные моменты времени. Однако в этом стандарте рассматриваются только (), представляющие определения, которые известны системе в данный момент времени.
4.7 База данныхБаза данных есть набор всех данных, определенных () в среде. Понятие среды является определяемым реализацией.
4.8 Модули() есть долговременно хранимый объект, определенный на языке модулей. () состоит из необязательного (), (), (), ноля или более курсоров, определенных через () и одной или более ().
Прикладная программа есть сегмент выполняемого кода, содержащий, возможно, несколько подпрограмм. Единственный () ассоциируется с прикладной программой в течение ее выполнения. Прикладная программа должна быть ассоциирована с самое большее одним (). Способ установления этой ассоциации, включающий возможное требование выполнения некоторого определенного в реализации оператора, определяется в реализации.
4.9 Процедуры() состоит из (), последовательности () и одного ().
Прикладная программа, ассоциированная с (), может обращаться к () этого () через оператор "call", в котором определяется () этой () и задается последовательность значений параметров, число и () которых соответствует () этой (). Вызов () приводит к выполнению содержащегося в ней ().
4.10 ПараметрыПараметр объявляется в () через (). () определяет () своего значения. Параметр либо принимает, либо поставляет значение соответствующего аргумента в вызове этой ().
4.10.1 Параметр SQLCODEПараметр SQLCODE - это специальный целый параметр. Его значение устанавливается равным коду состояния, который либо означает, что вызов () завершился успешно, либо, что в течение выполнения () возникла исключительная ситуация.
4.10.2 Параметр-индикаторПараметр-индикатор - это целый параметр, который указывается после другого параметра. Его основное назначение - показывать, может ли значение другого параметра (принимаемого или поставляемого) быть неопределенным значением.
4.11 Стандартные языки программированияСтандарт определяет действия () в (), когда эти () вызываются программами, соответствующими определенным стандартным языкам программирования. Термины "стандартная программа на языке COBOL", "стандартная программа на языке FORTRAN", "стандартная программа на языке Pascal" и "стандартная программа на языке PL/1" относятся к программам, отвечающим критериям соответствия стандартов, перечисленных в разделе 2, "Ссылки" .
4.12 КурсорыКурсор определяется через (). Для каждого () в () курсор фактически cоздается тогда, когда образуется транзакция (см. 4.16, "Транзакции"), ссылающаяся на этот (), и уничтожается, когда эта транзакция завершается.
Курсор находится либо в открытом состоянии, либо в закрытом состоянии. Начальное состояние курсора - закрытое. Курсор переходит в открытое состояние через () и возвращается в закрытое состояние через (), () или ().
Курсор в открытом состоянии определяет таблицу, порядок строк в этой таблице и позицию относительно этого порядка. Если () не включает () или включает (), не полностью определяющий порядок строк, то строки в таблице имеют порядок, полностью или частично определенный в реализации.
Внутри одной транзакции, если порядок строк не определен или не полностью определен через (), относительная позиция двух строк будет в общем случае одна и та же при каждом открытии курсора. Порядок может изменяться от одного раза к другому, если меняются значения базы данных или значения параметров, указанных в () в ().
В разных транзакциях, даже когда значения базы данных и значения параметров, указанных в (), одинаковы, порядок строк, определяемый одинаковыми () и (), может быть различным.
Позиция курсора в открытом состоянии может быть перед определенной строкой, на определенной строке или после последней строки. Если курсор установлен на строку, то эта строка является текущей строкой курсора. Курсор может быть установлен перед первой строкой или после последней строки, даже если таблица пуста.
() продвигает позицию открытого курсора на следующую строку в порядке этого курсора и выбирает значения столбцов этой строки. () изменяет текущую строку курсора. ( удаляет текущую строку курсора.
Если курсор установлен перед некоторой строкой, и новая строка заносится в эту позицию, то оказываемое этим возможное влияние на позицию курсора, если и есть, определяется в реализации.
Если курсор установлен на некоторую строку или перед некоторой строкой, и эта строка удаляется, то курсор устанавливается перед строкой, непосредственно следующей за позицией удаленной строки. Если такая строка не существует, то курсор устанавливается после последней строки.
Если при выполнении (), ссылающегося на открытый курсор, возникает ошибка, то возможное действие этого на позицию или состояние курсора определяется в реализации.
Рабочая таблица - это таблица, возникающая вследствие открытия курсора. Приводит ли открытие курсора к созданию рабочей базовой таблицы или рабочей представляемой таблицы, определяется в реализации.
Каждая строка рабочей представляемой таблицы порождается только тогда, когда курсор позиционируется на эту строку.
Рабочая базовая таблица создается при открытии курсора и уничтожается при закрытии курсора.
4.13 Операторы() определяет операцию над базой данных или операцию над курсором. () читает значения из таблицы. () заносит строки в таблицу. () или () изменяет значения строк таблицы. () или () удаляет строки из таблицы.
4.14 Синтаксис встраивания() ( (), (), () или ()) - это прикладная программа, которая содержит текст на языке программирования и текст на языке SQL. Текст на языке программирования должен удовлетворять требованиям конкретного стандарта языка программирования. Текст на языке SQL должен состоять из одного или более () и (необязательно) из одной или более (). Это позволяет представлять приложения базы данных в гибридной форме, в которой () прямо встроены в прикладную программу. Такая гибридная прикладная программа по определению должна быть эквивалентна стандартной прикладной программе, в которой () заменены на вызовы () SQL в отдельном () SQL.
4.15 ПривилегииПривилегия разрешаетвыполнить данную категорию () над указанной таблицей или представлением на основе указанного ().Допустимыми () являются INSERT, DELETE, SELECT, UPDATE и REFERENCES.
() определяется для каждой () и ().
(), определенный для (), должен отличаться от () любой другой () в той же среде. () для () является "владельцем" всех таблиц и представлений, определенных в этой ().
Таблицы и представления обозначаются (). () состоит из () и (). () идентифицирует (), в которой были определены таблица или представле- ние, обозначаемые (). Таблицы и представления, определенные в различных (), могут иметь одинаковые ().
Если ссылка на () не содержит явно (), то по умолчанию указывается () содержащих () или ().
() для () обладает всеми привилегиями по отношению к таблицам и представлениям, определенным в этой ().
() с данным () может содержать (), которые передают привилегии другим (). Переданные привилегии могут относиться к таблицам и представлениям, определенным в текущей (), или могут быть привилегиями, которые были переданы данному () другой (). Раздел WITH GRANT OPTION () определяет, может ли получатель привилегии передавать ее другим.
() специфицирует , (), который должен обладать привилегиями, достаточными для выполнения каждого () в ().
4.16 ТранзакцииТранзакция есть последовательность операций, включающая операции над базой данных, атомарная по отношению к восстановлению и асинхронности. Транзакция начинается, когда вызывается процедура и никакая транзакция в данный момент не активна. Транзакция заканчивается при выполнении () или (). Если транзакция завершается выполнением (), все изменения, внесенные в базу данных этой транзакцией делаются доступными для всех асинхронно выполняемых транзакций. Если транзакция завершается выполнением (), все изменения, внесенные в базу данных этой транзакцией, аннулируются. Зафиксированные изменения не могут быть аннулированы. Изменения, внесенные в базу данных транзакцией, могут восприниматься этой транзакцией, но до тех пор, пока транзакция не завершится выполнением (), они не могут восприниматься другими транзакциями.
Гарантируется сериализуемость выполнения асинхронных транзакций. Сериализуемое выполнение определяется как выполнение операций асинхронно выполняемых транзакций, которое производит то же самое действие, что и некоторое последовательное выполнение тех же самых транзакций. Последовательное выполнение - это такое выполнение, при котором каждая транзакция полностью завершается перед началом выполнения следующей транзакции.
Выполнение () внутри транзакции не оказывает никаких воздействий на базу данных кроме тех, которые установлены Общими правилами для этого ().
Из этого совместно с гарантированным сериализуемым выполнением транзакций следует воспроизводимость всех операций чтения внутри транзакции, если не учитывать следующего:
Влияния изменений базы данных и ее содержимого, явно производимых самой транзакцией.
Влияния изменений значений параметров, поставляемых процедурам, которые открывают курсоры, на последующие выборки через эти курсоры.