SQL: Uma Linguagem de Consulta 1 Exemplos ilustrativos Considere, como exemplos, as seguintes relações: R1 sid bid day 22 101 10/10/96 58 103 11/12/96 Se a chave para a relacão de Reservas (R1) contivesse somente os atributos sid e bid como mudaria a semântica? S1 S2 sid snam e rating age 22 dustin 7 45.0 31 lubber 8 55.5 58 rusty 10 35.0 sid snam e rating age 28 yuppy 9 35.0 31 lubber 8 55.5 44 guppy 5 35.0 58 rusty 10 35.0 2 1
Consulta Básica SQL SELECT FROM WHERE [DISTINCT] target-list relation-list qualification relation-list Uma lista de relações (possivelmente com uma range-variable depois de cada nome). target-list Uma lista de atributos das relações em relation-list qualification Comparações (entre atributos e/ou constantes) combinadas usando AND, OR e NOT. DISTINCT é uma palavra chave opcional indicando que a resposta não deve contem duplicações. Duplicações não são eliminadas por default! (porque?) 3 Estratégia de Avaliação Conceitual A Semântica de uma consulta SQL é definida com a seguintes estratégia de avaliação conceitual : Computar o produto-cartesiano da relation-list. Descartar tuplas se elas falharem qualifications. Deletar atributos que não estão na target-list. Se DISTINCT é especificada, eliminar duplicações. Esta estratégia é provavelmente a menos eficiente para computar uma consulta! Um otimizador achará mais estratégias eficientes para computar as mesmas respostas. 4 2
Exemplos de Avaliação Conceitual SELECT S.sname, Reserves R WHERE S.sid=R.sid AND R.bid=103 (sid) sname rating age (sid) bid day 22 dustin 7 45.0 22 101 10/10/96 22 dustin 7 45.0 58 103 11/12/96 31 lubber 8 55.5 22 101 10/10/96 31 lubber 8 55.5 58 103 11/12/96 58 rusty 10 35.0 22 101 10/10/96 58 rusty 10 35.0 58 103 11/12/96 5 Uma Nota sobre Range Variables Somente necessário se uma mesma relação aparecer duas vezes na condição FROM. A consulta anterior também pode ser escrita como: OR SELECT S.sname, Reserves R WHERE S.sid=R.sid AND bid=103 SELECT sname FROM Sailors, Reserves WHERE Sailors.sid=Reserves.sid AND bid=103 Todavia usar range variables é uma boaidéia (estilo)! 6 3
Que sailors reservaram pelo menos 1 barco? SELECT S.sid, Reserves R WHERE S.sid=R.sid Adicionar DISTINCT para esta consulta, pode fazer alguma diferença? Qual o efeito ao substituir S.sid por S.sname na condição SELECT? Adicionar DISTINCT para esta variante de consulta pode fazer diferença? 7 Expressões e Strings SELECT S.age, age1=s.age-5, 2*S.age AS age2 WHERE S.sname LIKE B_%B Ilustra o uso de expressões e padrões de strings: Forma triplas (idade dos marinheiros e 2 atributos definidos por expressões) para marinheiros cujo nomes comecem e terminem com B e contenham 3 ou mais letras AS e = servem para nominar campos no resultado. LIKE é usado para strings. `_ representa qualquer letra e `% representa 0 ou mais letras. 8 4
Achar sid s de sailors que reservaram um barco vermelho ou um verde. UNION: Pode ser usado para computar a união de dois conjuntos de tuplas compatíveis (que são eles mesmos resultado de uma consulta SQL). Se substituirmos OR por AND na primeira versão, o que teremos? Também disponível: EXCEPT (O que teremos se substituirmos UNION by EXCEPT?) SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND (B.color= red OR B.color= green ) SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= red UNION SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= green 9 Achar Sid s de marinheiros que tenham reservado um barco vermelho e um verde. INTERSECT: Usado para computar a intersecção de qualquer dois conjuntos compatíveis de tuplas. Incluido no padrão SQL/92 mas não suportado por alguns sistemas. SELECT S.sid, Boats B1, Reserves R1, Boats B2, Reserves R2 WHERE S.sid=R1.sid AND R1.bid=B1.bid AND S.sid=R2.sid AND R2.bid=B2.bid AND (B1.color= red AND B2.color= green ) Key field! SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= red INTERSECT SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= green 10 5
Consultas Aninhadas Ache nomes de marinheiros que reservaram barco #103 SELECT S.sname WHERE S.sid IN (SELECT R.sid FROM Reserves R WHERE R.bid=103) Uma característica poderosa de SQL: Uma condição WHERE pode conter uma consulta SQL! (De fato, condições FROM e HAVING também podem) Para achar marinheiros que não tem reservas #103, use NOT IN. 11 Consultas aninhadas correlacionadas Achar nomes de marinheiros que reservaram barco #103: SELECT S.sname WHERE EXISTS (SELECT * FROM Reserves R WHERE R.bid=103 AND S.sid=R.sid) EXISTS é outra comparação, como IN. Se UNIQUE é usado, e * é substituído por R.bid, acha marinheiros com pelo menos uma reserva para o barco #103. (UNIQUE verifica tuplas duplicadas; Porque temos que substituir * por R.bid?) Neste caso subconsultas tem que ser re-computadas por cada tupla de marinheiros. 12 6
Ainda sobre operadores de conjuntos IN, EXISTS e UNIQUE pode-se também NOT, i.e., usar NOT IN, NOT EXISTS e NOT UNIQUE. Também disponíveis: op ANY, op ALL, op IN, onde op é >, <, =, etc. Achar marinheiros que cujo taxa é maior do que algum marinheiro chamado Horatio: SELECT * WHERE S.rating > ANY (SELECT S2.rating 2 WHERE S2.sname= Horatio ) 13 Escrevendo consultas INTERSECT usando IN Encontre os sid s que reservaram um barco vermelho e um barco verde : SELECT S.sid, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= red AND S.sid IN (SELECT S2.sid 2, Boats B2, Reserves R2 WHERE S2.sid=R2.sid AND R2.bid=B2.bid AND B2.color= green ) De modo similar, consultas EXCEPT podem ser reescritas usando NOT IN. Para achar nomes substitua S.sid por S.sname na condição SELECT. (Funciona com INTERSECT?) 14 7
Divisão em SQL Encontre os marinheiros que reservaram todos barcos. SELECT S.sname WHERE NOT EXISTS ((SELECT B.bid FROM Boats B) EXCEPT (SELECT R.bid FROM Reserves R WHERE R.sid=S.sid)) 15 Divisão em SQL Sem EXCEPT: SELECT S.sname (2) WHERE NOT EXISTS (SELECT B.bid FROM Boats B WHERE NOT EXISTS (SELECT R.bid FROM Reserves R Sailors S such that... WHERE R.bid=B.bid there is no boat B without... AND R.sid=S.sid)) a Reserves tuple showing S reserved B 16 8
Operadores de Agregação Extensão significante da álgebra relacional. SELECT COUNT (*) SELECT AVG (S.age) WHERE S.rating=10 SELECT S.sname COUNT ( [DISTINCT] A) SUM ( [DISTINCT] A) AVG ( [DISTINCT] A) MAX (A) MIN (A) single column WHERE S.rating= (SELECT MAX(S2.rating) 2) SELECT COUNT (DISTINCT S.rating) WHERE S.sname= Bob SELECT AVG ( DISTINCT S.age) WHERE S.rating=10 17 Achar nome e idade do(s) marinheiro(s) mais velho(s) A primeira consulta é ilegal (?) A terceira consulta é equivalente a segunda consulta, e é considerada no padrão SQL/92, mas não é suportada em alguns sistemas. SELECT S.sname, MAX (S.age) SELECT S.sname, S.age WHERE S.age = (SELECT MAX (S2.age) 2) SELECT S.sname, S.age WHERE (SELECT MAX (S2.age) 2) = S.age 18 9
GROUP BY e HAVING Até agora, temos aplicados operadores de agregação para todas as tuplas (qualificadas). Algumas vezes, queremos aplicá-los para cada um de diferentes grupo de tuplas. Ache a idade do mais jovem para cada nível de taxa. em geral, não sabemos quantos níveis de taxas existem, e o quais são os valores destas taxas para estes níveis. Suponha que sabemos que estes valores de taxas vão de 1 à 10, isso é razoavel? SELECT MIN (S.age) For i = 1, 2,..., 10: WHERE S.rating = i 19 Consultas com GROUP BY e HAVING A target-list contem (i) atributos (ii) termos com operações de agrega,cão (e.g., MIN (S.age)). Os atributos (i) tem que ser um sub conjunto de grouping-list. Intuitivamente, cada resposta tupla corresponde a um grupo, e estes atributos tem que ter um valor simples por grupo. (Um grupo é um conjunto de tuplas que tem o mesmo valor para todos os atributos em grouping-list.) SELECT [DISTINCT] target-list FROM relation-list WHERE qualification GROUP BY grouping-list HAVING group-qualification 20 10
Avaliação Conceitual O produto cartesiano da relation-list é computado, tuplas que falham qualification são descartadas, campos `desnecessários são deletados e as tuplas restantes são divididas em grupos pelo valor dos atributos em grouping-list. O group-qualification é então aplicado para eliminar alguns grupos. Expressões em group-qualification tem que ter um valor singular por grupo! Para todos os efeitos, um atributo no group-qualification que não é um argumento de um operador agregado também aparece no grouping-list. 21 Qual a menor idade do marinheiro com + de 18 anos, para cada grupo de taxa com 2 ou + tais mariheiros SELECT S.rating, MIN (S.age) WHERE S.age >= 18 GROUP BY S.rating HAVING COUNT (*) > 1 Somente S.rating e S.age são mencionados nas condições SELECT, GROUP BY or HAVING; Outros atributos desnecessários. Segunda coluna de resultados não é nominada. (Use AS para nomina-la.) sid sname rating age 22 dustin 7 45.0 31 lubber 8 55.5 71 zorba 10 16.0 64 horatio 7 35.0 29 brutus 1 33.0 58 rusty 10 35.0 rating age 1 33.0 7 45.0 7 35.0 8 55.5 10 35.0 rating 7 35.0 Answer relation 22 11
Para cada barco vermelho, qual o o número de reservas para este barco SELECT B.bid, COUNT (*) AS scount, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= red GROUP BY B.bid Agrupando uma junção combinação de tres relações. O que teremos se removermos B.color= red da condição WHERE e adicionamos uma condição HAVING com esta condição? E se retirarmos Sailors e a condição envolvendo S.sid? 23 Qual a idade do marinheiro mais jovem com idade >= 18, para cada grupo de taxa com 2 ou + marinheiros SELECT S.rating, MIN (S.age) WHERE S.age >= 18 GROUP BY S.rating HAVING 1 < (SELECT COUNT (*) 2 WHERE S.rating=S2.rating) A condição HAVING pode conter uma subconsulta. Compare com a consulta anterior 24 12
Encontre as taxas para as quais a idade média a menor sobre todas as taxas. Operadores de agregação não podem ser aninhados. ERRADO: SELECT S.rating WHERE S.age = (SELECT MIN (AVG (S2.age)) 2) Solução correta (in SQL/92): SELECT Temp.rating, Temp.avgage FROM (SELECT S.rating, AVG (S.age) AS avgage GROUP BY S.rating) AS Temp WHERE Temp.avgage = (SELECT MIN (Temp.avgage) FROM Temp) 25 Valores Nulos Os valores no campo de uma tupla são algumas vezes desconhecidos ou não aplicaveis inapplicable SQL tem um valor nulo especial para estas situações. A presença de null complica muitos resultados. P.ex.: Operadores especiais para verificar se o valor é ou não nulo. rating>8 é verdadeiro ou falso quando rating é igual a nulo? (Precisamos uma lógica de 3-valores). O significado das construção tem ser definido cuidadosamente. (e.g., condição WHERE elimina linhas que não são avaliadas como verdade.) Novos operadores (em particular, para outer joins) possíveis/necessários 26 13
SQL Embutido Comandos SQL podem ser chamados de dentro de um linguagem hospedeira (e.g., C ou COBOL) Comandos SQL podem se referir a host variables (incluindo variáveis especiais usadas para retornar o status). Deve incluir um comando para connectar ao banco de dados certo. Relações SQL são (multi-)conjuntos de registros, limite do número de registros não limitados a priori. Não há estruturas de dados similar em C. Para isso SQL suporta um mecanismo chamado cursor. 27 Cursores Podem ser declarados sobre uma relação ou consulta Pode-se abrir um cursor, e (repetidamente) capturar tuplas, movendo o cursor. Pode usar uma clásula especial, chamada ORDER BY, em consultas que são acessadas por cursor, para controlar a ordem na qual as tuplas são retornadas. Campos em ORDER BY tem que aparecer também na condição SELECT. A condição ORDER BY, que ordena a resposta tuplas, é permitidas somente no contexto de um cursor. Pode-se também modificar/deletar tupla apontada por um cursor. 28 14
Cursor com nomes de marinheiros que reservaram um barco vermelho, em ordem alfabética. EXEC SQL DECLARE sinfo CURSOR FOR SELECT S.sname, Boats B, Reserves R WHERE S.sid=R.sid AND R.bid=B.bid AND B.color= red ORDER BY S.sname Note que é ilegal substituir S.sname por, digamos S.sid na consulta (Porque?) Podemos adicionar S.sid para a consulta SELECT e substituir S.sname por S.sid na consulta in the ORDER BY? 29 Embutindo SQL em C: Um Exemplo. char SQLSTATE[6]; EXEC SQL BEGIN DECLARE SECTION char c_sname[20]; short c_minrating; float c_age; EXEC SQL END DECLARE SECTION c_minrating = random(); EXEC SQL DECLARE sinfo CURSOR FOR SELECT S.sname, S.age WHERE S.rating > :c_minrating ORDER BY S.sname; do { EXEC SQL FETCH sinfo INTO :c_sname, :c_age; printf( %s is %d years old\n, c_sname, c_age); } while (SQLSTATE!= 02000 ); EXEC SQL CLOSE sinfo; 30 15
Resumo Mais natural que antes, procedimentos de consulta de linguagens. Relacionalmente completa; e significantemente mais expressiva do que algebra relacional. Mesmo consultas que podem ser expressadas em AR podem frequentemente ser expressadas mais naturalmente em SQL. Vários caminhos alternativos para escrever uma consulta; otimizador deve procurar pelo plano de avaliação mais eficiente. na prática, usuários precisam estar atentos como as consultas podem ser otimizadas e avaliadas para melhores resultados. 31 16