Lógica de primer orden - First-order logic

La lógica de primer orden, también conocida como lógica de predicados , lógica cuantificacional y cálculo de predicados de primer orden, es una colección de sistemas formales utilizados en matemáticas , filosofía , lingüística e informática . La lógica de primer orden usa variables cuantificadas sobre objetos no lógicos y permite el uso de oraciones que contienen variables, de modo que en lugar de proposiciones como "Sócrates es un hombre", se pueden tener expresiones en la forma "existe x tal que x es Sócrates yx es un hombre ", donde" existe " es un cuantificador, mientras que x es una variable. Esto la distingue de la lógica proposicional , que no usa cuantificadores ni relaciones ; en este sentido, la lógica proposicional es el fundamento de la lógica de primer orden.

Una teoría sobre un tema suele ser una lógica de primer orden junto con un dominio específico del discurso (sobre el cual se extienden las variables cuantificadas), un número finito de funciones desde ese dominio hasta sí mismo, un número finito de predicados definidos en ese dominio y un conjunto de axiomas. creía tener sobre ellos. A veces, la "teoría" se entiende en un sentido más formal, que es simplemente un conjunto de oraciones en lógica de primer orden.

El adjetivo "primer orden" distingue la lógica de primer orden de la lógica de orden superior , en la que hay predicados que tienen predicados o funciones como argumentos, o en los que se permiten cuantificadores de predicado o cuantificadores de función o ambos. En las teorías de primer orden, los predicados a menudo se asocian con conjuntos. En las teorías de orden superior interpretadas, los predicados pueden interpretarse como conjuntos de conjuntos.

Hay muchos sistemas deductivos para la lógica de primer orden que son a la vez sólidos (es decir, todos los enunciados demostrables son verdaderos en todos los modelos) y completos (es decir, todos los enunciados que son verdaderos en todos los modelos son probables). Aunque la relación de consecuencia lógica es sólo semidecidible , se ha avanzado mucho en la demostración automatizada de teoremas en lógica de primer orden. La lógica de primer orden también satisface varios teoremas metalógicos que la hacen susceptible de análisis en la teoría de la demostración , como el teorema de Löwenheim-Skolem y el teorema de la compacidad .

La lógica de primer orden es el estándar para la formalización de las matemáticas en axiomas y se estudia en los fundamentos de las matemáticas . La aritmética de Peano y la teoría de conjuntos de Zermelo-Fraenkel son axiomatizaciones de la teoría de números y la teoría de conjuntos , respectivamente, en lógica de primer orden. Sin embargo, ninguna teoría de primer orden tiene la fuerza para describir de manera única una estructura con un dominio infinito, como los números naturales o la línea real . Los sistemas de axiomas que describen completamente estas dos estructuras (es decir, sistemas de axiomas categóricos ) se pueden obtener en lógicas más sólidas, como la lógica de segundo orden .

Los fundamentos de la lógica de primer orden fueron desarrollados de forma independiente por Gottlob Frege y Charles Sanders Peirce . Para una historia de la lógica de primer orden y cómo llegó a dominar la lógica formal, véase José Ferreirós (2001).

Introducción

Mientras que la lógica proposicional se ocupa de proposiciones declarativas simples, la lógica de primer orden también cubre los predicados y la cuantificación .

Un predicado toma una entidad o entidades del dominio del discurso como entrada, mientras que las salidas son verdaderas o falsas . Considere las dos oraciones "Sócrates es un filósofo" y "Platón es un filósofo". En la lógica proposicional , estas oraciones se consideran no relacionadas y podrían denotarse, por ejemplo, por variables como p y q . El predicado "es un filósofo" aparece en ambas oraciones, que tienen una estructura común de " a es un filósofo". La variable a se ejemplifica como "Sócrates" en la primera oración, y se ejemplifica como "Platón" en la segunda oración. Mientras que la lógica de primer orden permite el uso de predicados, como "es un filósofo" en este ejemplo, la lógica proposicional no.

Las relaciones entre predicados se pueden establecer utilizando conectivos lógicos . Considere, por ejemplo, la fórmula de primer orden "si a es un filósofo, entonces a es un erudito". Esta fórmula es una declaración condicional con " a es un filósofo" como su hipótesis y " a es un erudito" como su conclusión. La verdad de esta fórmula depende de qué objeto se denota por a , y de las interpretaciones de los predicados "es un filósofo" y "es un erudito".

Los cuantificadores se pueden aplicar a variables en una fórmula. La variable a en la fórmula anterior se puede cuantificar universalmente, por ejemplo, con la oración de primer orden "Para cada a , si a es un filósofo, entonces a es un erudito". El cuantificador universal "para todos" en esta oración expresa la idea de que la afirmación "si a es un filósofo, entonces a es un erudito" se aplica a todas las opciones de a .

La negación de la frase "Por cada una , si una es un filósofo, a continuación, una es un erudito" es lógicamente equivalente a la frase "No existe un tal que una es un filósofo y un no es un académico". El cuantificador existencial "existe" expresa la idea de que la afirmación " a es un filósofo y a no es un erudito" vale para alguna elección de a .

Los predicados "es un filósofo" y "es un erudito" toman cada uno una sola variable. En general, los predicados pueden tomar varias variables. En la oración de primer orden "Sócrates es el maestro de Platón", el predicado "es el maestro de" toma dos variables.

Una interpretación (o modelo) de una fórmula de primer orden especifica lo que significa cada predicado y las entidades que pueden instanciar las variables. Estas entidades forman el dominio del discurso o universo, que generalmente se requiere que sea un conjunto no vacío. Por ejemplo, en una interpretación con el dominio del discurso que consiste en todos los seres humanos y el predicado "es un filósofo" entendido como "fue el autor de la República ", la frase "No existe un tal que una es un filósofo" se ve como verdadero, como lo atestigua Platón.

Sintaxis

Hay dos partes clave de la lógica de primer orden. La sintaxis determina qué secuencias finitas de símbolos son expresiones bien formadas en lógica de primer orden, mientras que la semántica determina los significados detrás de estas expresiones.

Alfabeto

A diferencia de los lenguajes naturales, como el inglés, el lenguaje de la lógica de primer orden es completamente formal, por lo que se puede determinar mecánicamente si una expresión dada está bien formada. Hay dos tipos clave de expresiones bien formadas: términos , que representan objetos intuitivamente, y fórmulas , que expresan predicados intuitivamente que pueden ser verdaderos o falsos. Los términos y fórmulas de la lógica de primer orden son cadenas de símbolos , donde todos los símbolos juntos forman el alfabeto del idioma. Como ocurre con todos los lenguajes formales , la naturaleza de los símbolos mismos está fuera del alcance de la lógica formal; a menudo se los considera simplemente letras y símbolos de puntuación.

Es común dividir los símbolos del alfabeto en símbolos lógicos , que siempre tienen el mismo significado, y símbolos no lógicos , cuyo significado varía según la interpretación. Por ejemplo, el símbolo lógico siempre representa "y"; nunca se interpreta como "o", que está representado por el símbolo lógico . Por otro lado, un símbolo predicado no lógico como Phil ( x ) podría interpretarse como " x es un filósofo", " x es un hombre llamado Philip", o cualquier otro predicado unario dependiendo de la interpretación en cuestión.

Símbolos lógicos

Hay varios símbolos lógicos en el alfabeto, que varían según el autor, pero generalmente incluyen:

  • Los símbolos cuantificadores : para cuantificación universal y para cuantificación existencial
  • Los conectivos lógicos : para conjunción , para disyunción , para implicación , para bicondicional , ¬ para negación. Ocasionalmente se incluyen otros símbolos conectivos lógicos. Algunos autores usan C pq , en lugar de , y E pq , en lugar de , especialmente en contextos donde → se usa para otros propósitos. Además, la herradura puede reemplazar ; la barra triple puede reemplazar a ; una tilde ( ~ ), N p o F p , pueden reemplazar a ¬ ; una barra doble , o A pq puede reemplazar a ; y & , K pq , o el punto del medio, , pueden reemplazar a , especialmente si estos símbolos no están disponibles por razones técnicas. (Los símbolos antes mencionados C pq , E pq , N p , A pq y K pq se utilizan en notación polaca ).
  • Paréntesis, corchetes y otros símbolos de puntuación. La elección de tales símbolos varía según el contexto.
  • Un conjunto infinito de variables , a menudo denotado por letras minúsculas al final del alfabeto x , y , z , .... Los subíndices se utilizan a menudo para distinguir variables: x 0 , x 1 , x 2 , ....
  • Un símbolo de igualdad (a veces, símbolo de identidad ) = (ver § Igualdad y sus axiomas más abajo).

No se requieren todos estos símbolos, solo uno de los cuantificadores, negación y conjunción, variables, paréntesis e igualdad es suficiente. Existen numerosas variaciones menores que pueden definir símbolos lógicos adicionales:

  • En algunas ocasiones, se incluyen las constantes de verdad T, V pq o , para "verdadero" y F, O pq , o , para "falso". Sin tales operadores lógicos de valencia 0, estas dos constantes solo se pueden expresar usando cuantificadores.
  • En otras ocasiones, se incluyen conectivos lógicos adicionales, como el trazo de Sheffer , D pq (NAND) y exclusivo o , J pq .

Símbolos no lógicos

Los símbolos no lógicos representan predicados (relaciones), funciones y constantes en el dominio del discurso. Solía ​​ser una práctica estándar utilizar un conjunto fijo e infinito de símbolos no lógicos para todos los propósitos. Una práctica más reciente es utilizar diferentes símbolos no lógicos según la aplicación que se tenga en mente. Por lo tanto, se ha vuelto necesario nombrar el conjunto de todos los símbolos no lógicos utilizados en una aplicación en particular. Esta elección se realiza mediante una firma .

El enfoque tradicional es tener un solo conjunto infinito de símbolos no lógicos (una firma) para todas las aplicaciones. En consecuencia, bajo el enfoque tradicional hay un solo lenguaje de lógica de primer orden. Este enfoque todavía es común, especialmente en libros de orientación filosófica.

  1. Para cada entero n  ≥ 0, hay una colección de n - ary , o n - lugar , símbolos de predicado . Debido a que representan relaciones entre n elementos, también se les llama símbolos de relación . Para cada aridad n , tenemos un suministro infinito de ellos:
    P n 0 , P n 1 , P n 2 , P n 3 , ...
  2. Para cada entero n  ≥ 0, hay infinitos símbolos de función n- aria :
    f n 0 , f n 1 , f n 2 , f n 3 , ...

En la lógica matemática contemporánea, la firma varía según la aplicación. Las firmas típicas en matemáticas son {1, ×} o simplemente {×} para grupos , o {0, 1, +, ×, <} para campos ordenados . No hay restricciones sobre el número de símbolos no lógicos. La firma puede ser vacía , finita o infinita, incluso incontable . Las firmas incontables ocurren, por ejemplo, en las demostraciones modernas del teorema de Löwenheim-Skolem .

En este enfoque, cada símbolo no lógico es de uno de los siguientes tipos.

  1. Un símbolo de predicado (o símbolo de relación ) con un poco de valencia (o aridad , número de argumentos) mayor o igual a 0. Estos son a menudo indican por letras mayúsculas tales como P , Q y R .
    • Las relaciones de valencia 0 se pueden identificar con variables proposicionales . Por ejemplo, P , que puede representar cualquier declaración.
    • Por ejemplo, P ( x ) es una variable predicada de valencia 1. Una posible interpretación es " x es un hombre".
    • Q ( x , y ) es una variable predicada de valencia 2. Las posibles interpretaciones incluyen " x es mayor que y " y " x es el padre de y ".
  2. Un símbolo de función , con algo de mayor valencia que o igual a 0. Estos son a menudo denota por minúsculas letras romanas tales como f , g y h .
    • Ejemplos: f ( x ) puede interpretarse como "el padre de x ". En aritmética , puede representar "-x". En teoría de conjuntos , puede representar "el conjunto de potencias de x". En aritmética, g ( x , y ) puede representar " x + y ". En la teoría de conjuntos, puede representar "la unión de x e y ".
    • Símbolos de función de valencia 0 se denominan símbolos constantes , y a menudo se designan con letras minúsculas en el principio del alfabeto, tales como un , b y c . El símbolo a puede representar a Sócrates. En aritmética, puede representar 0. En teoría de conjuntos, tal constante puede representar el conjunto vacío .

El enfoque tradicional se puede recuperar en el enfoque moderno, simplemente especificando la firma "personalizada" para que consista en las secuencias tradicionales de símbolos no lógicos.

Reglas de formación

Las reglas de formación definen los términos y fórmulas de la lógica de primer orden. Cuando los términos y fórmulas se representan como cadenas de símbolos, estas reglas se pueden usar para escribir una gramática formal para términos y fórmulas. Estas reglas generalmente no tienen contexto (cada producción tiene un solo símbolo en el lado izquierdo), excepto que se puede permitir que el conjunto de símbolos sea infinito y puede haber muchos símbolos de inicio, por ejemplo, las variables en el caso de los términos .

Condiciones

El conjunto de términos se define inductivamente por las siguientes reglas:

  1. Variables. Cualquier variable es un término.
  2. Funciones. Cualquier expresión f ( t 1 , ..., t n ) de n argumentos (donde cada argumento t i es un término y f es un símbolo de función de valencia n ) es un término. En particular, los símbolos que denotan constantes individuales son símbolos de función nula y, por lo tanto, son términos.

Sólo las expresiones que pueden obtenerse mediante un número finito de aplicaciones de las reglas 1 y 2 son términos. Por ejemplo, ninguna expresión que involucre un símbolo de predicado es un término.

Fórmulas

El conjunto de fórmulas (también llamadas fórmulas bien formadas o WFF ) se define inductivamente mediante las siguientes reglas:

  1. Símbolos de predicados. Si P es un símbolo de predicado n -ario y t 1 , ..., t n son términos, entonces P ( t 1 , ..., t n ) es una fórmula.
  2. Igualdad . Si el símbolo de igualdad se considera parte de la lógica y t 1 y t 2 son términos, entonces t 1 = t 2 es una fórmula.
  3. Negación. Si es una fórmula, entonces es una fórmula.
  4. Conectivos binarios. Si y son fórmulas, entonces ( ) es una fórmula. Se aplican reglas similares a otras conectivas lógicas binarias.
  5. Cuantificadores. Si es una fórmula y x es una variable, entonces (para todo x, se cumple) y (existe x tal que ) son fórmulas.

Sólo las expresiones que pueden obtenerse mediante un número finito de aplicaciones de las reglas 1 a 5 son fórmulas. Se dice que las fórmulas obtenidas de las dos primeras reglas son fórmulas atómicas .

Por ejemplo,

es una fórmula, si f es un símbolo de función unaria, P un símbolo de predicado unario y Q un símbolo de predicado ternario. Por otro lado, no es una fórmula, aunque es una cadena de símbolos del alfabeto.

El papel de los paréntesis en la definición es garantizar que cualquier fórmula solo se pueda obtener de una manera: siguiendo la definición inductiva (es decir, hay un árbol de análisis sintáctico único para cada fórmula). Esta propiedad se conoce como legibilidad única de fórmulas. Hay muchas convenciones sobre el uso de paréntesis en las fórmulas. Por ejemplo, algunos autores utilizan dos puntos o puntos en lugar de paréntesis, o cambian los lugares en los que se insertan los paréntesis. La definición particular de cada autor debe ir acompañada de una prueba de legibilidad única.

Esta definición de una fórmula no admite la definición de una función si-entonces-si no ite(c, a, b), donde "c" es una condición expresada como una fórmula, que devolvería "a" si c es verdadero y "b" si es falso. Esto se debe a que tanto los predicados como las funciones solo pueden aceptar términos como parámetros, pero el primer parámetro es una fórmula. Algunos lenguajes basados ​​en lógica de primer orden, como SMT-LIB 2.0, agregan esto.

Convenciones de notación

Por conveniencia, se han desarrollado convenciones sobre la precedencia de los operadores lógicos, para evitar la necesidad de escribir paréntesis en algunos casos. Estas reglas son similares al orden de las operaciones en aritmética. Una convención común es:

  • se evalúa primero
  • y se evalúan a continuación
  • Los cuantificadores se evalúan a continuación
  • se evalúa en último lugar.

Además, se puede insertar puntuación adicional que no requiera la definición, para facilitar la lectura de las fórmulas. Así la fórmula

podría estar escrito como

En algunos campos, es común usar notación infija para funciones y relaciones binarias, en lugar de la notación prefija definida anteriormente. Por ejemplo, en aritmética, normalmente se escribe "2 + 2 = 4" en lugar de "= (+ (2,2), 4)". Es común considerar las fórmulas en notación infija como abreviaturas de las fórmulas correspondientes en notación prefijada, cf. también estructura de términos vs. representación .

Las definiciones anteriores usan notación infija para conectivos binarios como . Una convención menos común es la notación polaca , en la que se escribe , y así sucesivamente frente a sus argumentos en lugar de entre ellos. Esta convención es ventajosa porque permite descartar todos los símbolos de puntuación. Como tal, la notación polaca es compacta y elegante, pero rara vez se usa en la práctica porque es difícil de leer para los humanos. En notación polaca, la fórmula

se convierte en "∀x∀y → Pfx¬ → PxQfyxz".

Variables libres y ligadas

En una fórmula, una variable puede aparecer libre o ligada (o ambas). Intuitivamente, la ocurrencia de una variable es libre en una fórmula si no está cuantificada: en y P ( x , y ) , la única ocurrencia de la variable x es libre mientras que la de y está ligada. Las ocurrencias de variables libres y ligadas en una fórmula se definen inductivamente como sigue.

Fórmulas atómicas
Si φ es una fórmula atómica, entonces x aparece libre en φ si y solo si x aparece en φ . Además, no hay variables ligadas en ninguna fórmula atómica.
Negación
x aparece libre en ¬ φ si y sólo si x aparece libre en φ . x ocurre ligado en ¬ φ si y solo si x ocurre ligado en φ
Conectivos binarios
x aparece libre en ( φψ ) si y solo si x aparece libre en φ o ψ . x aparece enlazado en ( φψ ) si y solo si x aparece enlazado en φ o ψ . La misma regla se aplica a cualquier otro conector binario en lugar de →.
Cuantificadores
x aparece libre en y φ , si y sólo si x aparece libre en φ y x es un símbolo diferente de y . Además, x aparece enlazado en y φ , si y solo si x es y o x aparece enlazado en φ . La misma regla se aplica con en lugar de .

Por ejemplo, en xy ( P ( x ) → Q ( x , f ( x ), z )) , x y y sólo se producen obligado, z se produce sólo libre, y w es ni porque no se produce en el fórmula.

Las variables libres y ligadas de una fórmula no necesitan ser conjuntos disjuntos: en la fórmula P ( x ) → ∀ x Q ( x ) , la primera aparición de x , como argumento de P , es libre mientras que la segunda, como argumento de Q , está obligado.

Una fórmula en lógica de primer orden sin ocurrencias de variables libres se llama oración de primer orden . Estas son las fórmulas que tendrán valores de verdad bien definidos bajo una interpretación. Por ejemplo, si una fórmula como Phil ( x ) es verdadera debe depender de lo que representa x . Pero la oración x Phil ( x ) será verdadera o falsa en una interpretación dada.

Ejemplo: grupos abelianos ordenados

En matemáticas, el lenguaje de los grupos abelianos ordenados tiene un símbolo constante 0, un símbolo de función unaria -, un símbolo de función binaria + y un símbolo de relación binaria ≤. Luego:

  • Las expresiones + ( x , y ) y + ( x , + ( y , - ( z ))) son términos . Por lo general, se escriben como x + y y x + y - z .
  • Las expresiones + ( x , y ) = 0 y ≤ (+ ( x , + ( y , - ( z ))), + ( x , y )) son fórmulas atómicas . Por lo general, se escriben como x + y = 0 y x + y - z  ≤  x + y .
  • La expresión es una fórmula , que generalmente se escribe como Esta fórmula tiene una variable libre, z .

Los axiomas para grupos abelianos ordenados se pueden expresar como un conjunto de oraciones en el idioma. Por ejemplo, el axioma que establece que el grupo es conmutativo generalmente se escribe

Semántica

Una interpretación de un idioma de primer orden asigna una denotación a cada símbolo no lógico en ese idioma. También determina un dominio de discurso que especifica el rango de los cuantificadores. El resultado es que a cada término se le asigna un objeto que representa, a cada predicado se le asigna una propiedad de objetos y a cada oración se le asigna un valor de verdad. De esta manera, una interpretación proporciona significado semántico a los términos, predicados y fórmulas del lenguaje. El estudio de las interpretaciones de lenguajes formales se denomina semántica formal . Lo que sigue es una descripción de la semántica estándar o de Tarsk para la lógica de primer orden. (También es posible definir la semántica del juego para la lógica de primer orden , pero además de requerir el axioma de elección , la semántica del juego concuerda con la semántica de Tarsk para la lógica de primer orden, por lo que la semántica del juego no se desarrollará aquí).

El dominio del discurso D es un conjunto no vacío de "objetos" de algún tipo. Intuitivamente, una fórmula de primer orden es una declaración sobre estos objetos; por ejemplo, establece la existencia de un objeto x tal que el predicado P es verdadero cuando se le refiere. El dominio del discurso es el conjunto de objetos considerados. Por ejemplo, se puede tomar como conjunto de números enteros.

La interpretación de un símbolo de función es una función. Por ejemplo, si el dominio del discurso consta de números enteros, un símbolo de función f de aridad 2 puede interpretarse como la función que da la suma de sus argumentos. En otras palabras, el símbolo f está asociado con la función que, en esta interpretación, es suma.

La interpretación de un símbolo constante es una función del conjunto de una sola elemento D 0 a D , que puede ser simplemente identificada con un objeto en D . Por ejemplo, una interpretación puede asignar el valor al símbolo constante .

La interpretación de un símbolo de predicado n -ario es un conjunto de n - tuplas de elementos del dominio del discurso. Esto significa que, dada una interpretación, un símbolo de predicado y n elementos del dominio del discurso, se puede decir si el predicado es verdadero de esos elementos de acuerdo con la interpretación dada. Por ejemplo, una interpretación I (P) de un símbolo de predicado binario P puede ser el conjunto de pares de números enteros de manera que el primero sea menor que el segundo. Según esta interpretación, el predicado P sería verdadero si su primer argumento es menor que el segundo.

Estructuras de primer orden

La forma más común de especificar una interpretación (especialmente en matemáticas) es especificar una estructura (también llamada modelo ; ver más abajo). La estructura consta de un conjunto D no vacío que forma el dominio del discurso y una interpretación I de los términos no lógicos de la firma. Esta interpretación es en sí misma una función:

  • Cada símbolo de la función f de aridad n se asigna una función de a D . En particular, a cada símbolo constante de la firma se le asigna un individuo en el dominio del discurso.
  • A cada símbolo de predicado P de aridad n se le asigna una relación sobre o, de manera equivalente, una función de a . Así, cada símbolo predicado es interpretada por una función de valor de Boolean en D .

Evaluación de valores de verdad

Una fórmula se evalúa como verdadera o falsa dada una interpretación, y una asignación de variable μ que asocia un elemento del dominio del discurso con cada variable. La razón por la que se requiere una asignación de variable es para dar significado a fórmulas con variables libres, como . El valor de verdad de esta fórmula cambia dependiendo de si x y y denotar el mismo individuo.

Primero, la asignación de variable μ puede extenderse a todos los términos del lenguaje, con el resultado de que cada término se asigna a un solo elemento del dominio del discurso. Las siguientes reglas se utilizan para realizar esta asignación:

  1. Variables. Cada variable x se evalúa como μ ( x )
  2. Funciones. Dados los términos que se han evaluado como elementos del dominio del discurso, y un símbolo de función n -aria f , el término se evalúa como .

A continuación, a cada fórmula se le asigna un valor de verdad. La definición inductiva utilizado para hacer esta asignación se denomina T-esquema .

  1. Fórmulas atómicas (1). A una fórmula se le asocia el valor verdadero o falso dependiendo de si , dónde están la evaluación de los términos y es la interpretación de , que por supuesto es un subconjunto de .
  2. Fórmulas atómicas (2). A una fórmula se le asigna verdadero si y se evalúa al mismo objeto del dominio del discurso (ver la sección sobre igualdad a continuación).
  3. Conectivos lógicos. Una fórmula en la forma , , etc. se evalúa de acuerdo con la tabla de verdad para el conectivo en cuestión, como en la lógica de proposiciones.
  4. Cuantificadores existenciales. Una fórmula es verdadera según M y si existe una evaluación de las variables que solo difiere de la evaluación de x y tal que φ es verdadera según la interpretación M y la asignación de variable . Esta definición formal captura la idea de que es verdadera si y solo si hay una manera de elegir un valor para x tal que se satisfaga φ ( x ).
  5. Cuantificadores universales. Una fórmula es verdadera de acuerdo con M y si φ ( x ) es verdadera para cada par compuesto por la interpretación M y alguna asignación de variable que difiera solo en el valor de x . Esto captura la idea de que es verdadera si cada elección posible de un valor para x hace que φ ( x ) sea verdadera.

Si una fórmula no contiene variables libres, y también una oración, entonces la asignación de variable inicial no afecta su valor de verdad. En otras palabras, una oración es verdadera de acuerdo con M y si y solo si es verdadera de acuerdo con M y todas las demás asignaciones de variables .

Existe un segundo enfoque común para definir valores de verdad que no se basa en funciones de asignación de variables. En cambio, dada una interpretación M , primero se agrega a la firma una colección de símbolos constantes, uno para cada elemento del dominio del discurso en M ; digamos que para cada d en el dominio el símbolo constante c d es fijo. La interpretación se amplía para que cada nuevo símbolo constante se asigne a su elemento correspondiente del dominio. Ahora se define sintácticamente la verdad para fórmulas cuantificadas, de la siguiente manera:

  1. Cuantificadores existenciales (alternativos). Una fórmula es verdadera según M si hay alguna d en el dominio del discurso tal que se cumpla. Aquí está el resultado de sustituir c d por cada ocurrencia libre de x en φ.
  2. Cuantificadores universales (alternativos). Una fórmula es cierto de acuerdo con M si, para cada d en el dominio de discurso, es cierto de acuerdo con la M .

Este enfoque alternativo da exactamente los mismos valores de verdad a todas las oraciones que el enfoque a través de asignaciones de variables.

Validez, satisfacibilidad y consecuencia lógica

Si una oración φ se evalúa como Verdadera bajo una interpretación dada M , se dice que M satisface φ; esto se denota . Una oración es satisfactoria si hay alguna interpretación bajo la cual es verdadera.

La satisfacción de fórmulas con variables libres es más complicada, porque una interpretación por sí sola no determina el valor de verdad de dicha fórmula. La convención más común es que se dice que una fórmula con variables libres se satisface mediante una interpretación si la fórmula permanece verdadera independientemente de qué individuos del dominio del discurso se asignan a sus variables libres. Esto tiene el mismo efecto que decir que una fórmula se satisface si y solo si se satisface su cierre universal .

Una fórmula es lógicamente válida (o simplemente válida ) si es verdadera en todas las interpretaciones. Estas fórmulas juegan un papel similar a las tautologías en la lógica proposicional.

Una fórmula φ es una consecuencia lógica de una fórmula ψ si toda interpretación que hace que ψ sea verdadero también hace que φ sea verdadero. En este caso, se dice que φ está lógicamente implícito en ψ.

Algebraizaciones

Un enfoque alternativo a la semántica de la lógica de primer orden procede a través del álgebra abstracta . Este enfoque generaliza las álgebras de lógica proposicional de Lindenbaum-Tarski . Hay tres formas de eliminar las variables cuantificadas de la lógica de primer orden que no implican reemplazar los cuantificadores con otros operadores de términos de vinculación de variables:

Todas estas álgebras son celosías que amplían adecuadamente el álgebra booleana de dos elementos .

Tarski y Givant (1987) demostraron que el fragmento de lógica de primer orden que no tiene una oración atómica dentro del alcance de más de tres cuantificadores tiene el mismo poder expresivo que el álgebra de relaciones . Este fragmento es de gran interés porque es suficiente para la aritmética de Peano y la teoría de conjuntos más axiomática , incluida la canónica ZFC . También prueban que la lógica de primer orden con un par ordenado primitivo es equivalente a un álgebra de relaciones con dos funciones de proyección de par ordenado .

Teorías de primer orden, modelos y clases de primaria.

Una teoría de primer orden de una firma particular es un conjunto de axiomas , que son oraciones que constan de símbolos de esa firma. El conjunto de axiomas es a menudo finito o recursivamente enumerable , en cuyo caso la teoría se llama efectiva . Algunos autores exigen que las teorías incluyan también todas las consecuencias lógicas de los axiomas. Se considera que los axiomas se sostienen dentro de la teoría y de ellos se pueden derivar otras oraciones que se sostienen dentro de la teoría.

Se dice que una estructura de primer orden que satisface todas las oraciones en una teoría dada es un modelo de la teoría. Una clase elemental es el conjunto de todas las estructuras que satisfacen una teoría particular. Estas clases son un tema principal de estudio en la teoría de modelos .

Muchas teorías tienen una interpretación intencionada , un cierto modelo que se tiene en cuenta al estudiar la teoría. Por ejemplo, la interpretación prevista de la aritmética de Peano consiste en los números naturales habituales con sus operaciones habituales. Sin embargo, el teorema de Löwenheim-Skolem muestra que la mayoría de las teorías de primer orden también tendrán otros modelos no estándar .

Una teoría es consistente si no es posible probar una contradicción a partir de los axiomas de la teoría. Una teoría es completa si, para cada fórmula en su firma, esa fórmula o su negación es una consecuencia lógica de los axiomas de la teoría. El teorema de incompletitud de Gödel muestra que las teorías de primer orden efectivas que incluyen una porción suficiente de la teoría de los números naturales nunca pueden ser consistentes y completas.

Para obtener más información sobre este tema, consulte la Lista de teorías y teoría de primer orden (lógica matemática)

Dominios vacíos

La definición anterior requiere que el dominio del discurso de cualquier interpretación no esté vacío. Hay configuraciones, como la lógica inclusiva , donde se permiten dominios vacíos. Además, si una clase de estructuras algebraicas incluye una estructura vacía (por ejemplo, hay un poset vacío ), esa clase solo puede ser una clase elemental en lógica de primer orden si se permiten dominios vacíos o la estructura vacía se elimina de la clase. .

Sin embargo, existen varias dificultades con los dominios vacíos:

  • Muchas reglas comunes de inferencia solo son válidas cuando se requiere que el dominio del discurso no esté vacío. Un ejemplo es la regla que indica que cuando x no es una variable libre en . Esta regla, que se utiliza para poner fórmulas en forma normal prenex , es válida en dominios no vacíos, pero errónea si se permite el dominio vacío.
  • La definición de verdad en una interpretación que utiliza una función de asignación de variable no puede funcionar con dominios vacíos, porque no hay funciones de asignación de variable cuyo rango esté vacío. (De manera similar, no se pueden asignar interpretaciones a símbolos constantes). Esta definición de verdad requiere que se seleccione una función de asignación de variable (μ arriba) antes de que se puedan definir valores de verdad para fórmulas atómicas pares. Luego, el valor de verdad de una oración se define como su valor de verdad bajo cualquier asignación de variable, y se demuestra que este valor de verdad no depende de qué asignación se elija. Esta técnica no funciona si no hay ninguna función de asignación; debe cambiarse para acomodar dominios vacíos.

Por lo tanto, cuando se permite el dominio vacío, a menudo debe tratarse como un caso especial. La mayoría de los autores, sin embargo, simplemente excluyen el dominio vacío por definición.

Sistemas deductivos

Un sistema deductivo se utiliza para demostrar, sobre una base puramente sintáctica, que una fórmula es una consecuencia lógica de otra fórmula. Existen muchos de estos sistemas para la lógica de primer orden, incluidos los sistemas deductivos al estilo de Hilbert , la deducción natural , el cálculo secuencial , el método de cuadros y la resolución . Estos comparten la propiedad común de que una deducción es un objeto sintáctico finito; el formato de este objeto y la forma en que se construye varían ampliamente. Estas deducciones finitas en sí mismas a menudo se denominan derivaciones en la teoría de la prueba. A menudo también se les llama pruebas, pero están completamente formalizadas a diferencia de las pruebas matemáticas en lenguaje natural .

Un sistema deductivo es sólido si cualquier fórmula que pueda derivarse en el sistema es lógicamente válida. Por el contrario, un sistema deductivo está completo si todas las fórmulas lógicamente válidas son derivables. Todos los sistemas discutidos en este artículo son sólidos y completos. También comparten la propiedad de que es posible verificar efectivamente que una deducción supuestamente válida es en realidad una deducción; tales sistemas de deducción se denominan efectivos .

Una propiedad clave de los sistemas deductivos es que son puramente sintácticos, por lo que las derivaciones se pueden verificar sin considerar ninguna interpretación. Por lo tanto, un argumento sólido es correcto en todas las posibles interpretaciones del lenguaje, independientemente de que se trate de matemáticas, economía o alguna otra área.

En general, la consecuencia lógica en la lógica de primer orden es solo semidecidible : si una oración A implica lógicamente una oración B, entonces esto se puede descubrir (por ejemplo, buscando una prueba hasta encontrar una, usando alguna prueba efectiva, sólida y completa sistema). Sin embargo, si A no implica lógicamente B, esto no significa que A implica lógicamente la negación de B. No existe un procedimiento efectivo que, dadas las fórmulas A y B, siempre decida correctamente si A implica lógicamente B.

Reglas de inferencia

Una regla de inferencia establece que, dada una fórmula particular (o conjunto de fórmulas) con una determinada propiedad como hipótesis, se puede derivar otra fórmula específica (o conjunto de fórmulas) como conclusión. La regla es sólida (o preserva la verdad) si preserva la validez en el sentido de que siempre que cualquier interpretación satisfaga la hipótesis, esa interpretación también satisface la conclusión.

Por ejemplo, una regla de inferencia común es la regla de sustitución . Si t es un término y φ es una fórmula que posiblemente contenga la variable x , entonces φ [ t / x ] es el resultado de reemplazar todas las instancias libres de x por t en φ. La regla de sustitución establece que para cualquier φ y cualquier término t , se puede concluir φ [ t / x ] a partir de φ siempre que ninguna variable libre de t quede ligada durante el proceso de sustitución. (Si alguna variable libre de t se vuelve ligada, entonces para sustituir t por x , primero es necesario cambiar las variables ligadas de φ para que difieran de las variables libres de t .)

Para ver por qué es necesaria la restricción de las variables ligadas, considere la fórmula lógicamente válida φ dada por , en la firma de (0,1, +, ×, =) de la aritmética. Si t es el término "x + 1", la fórmula φ [ t / y ] es , que será falsa en muchas interpretaciones. El problema es que la variable libre x de t se ligó durante la sustitución. El reemplazo deseado se puede obtener cambiando el nombre de la variable ligada x de φ a otra cosa, digamos z , de modo que la fórmula después de la sustitución sea , que nuevamente es lógicamente válida.

La regla de sustitución demuestra varios aspectos comunes de las reglas de inferencia. Es completamente sintáctico; se puede saber si se aplicó correctamente sin apelar a ninguna interpretación. Tiene limitaciones (definidas sintácticamente) sobre cuándo se puede aplicar, que deben respetarse para preservar la corrección de las derivaciones. Además, como suele ser el caso, estas limitaciones son necesarias debido a las interacciones entre las variables libres y ligadas que ocurren durante las manipulaciones sintácticas de las fórmulas involucradas en la regla de inferencia.

Sistemas de estilo Hilbert y deducción natural

Una deducción en un sistema deductivo al estilo de Hilbert es una lista de fórmulas, cada una de las cuales es un axioma lógico , una hipótesis que se ha asumido para la derivación en cuestión o que se sigue de fórmulas anteriores mediante una regla de inferencia. Los axiomas lógicos consisten en varios esquemas de axiomas de fórmulas lógicamente válidas; estos abarcan una cantidad significativa de lógica proposicional. Las reglas de inferencia permiten la manipulación de cuantificadores. Los sistemas típicos del estilo de Hilbert tienen una pequeña cantidad de reglas de inferencia, junto con varios esquemas infinitos de axiomas lógicos. Es común tener solo modus ponens y generalización universal como reglas de inferencia.

Los sistemas de deducción natural se asemejan a los sistemas de estilo Hilbert en que una deducción es una lista finita de fórmulas. Sin embargo, los sistemas de deducción natural no tienen axiomas lógicos; compensan agregando reglas adicionales de inferencia que se pueden usar para manipular los conectivos lógicos en fórmulas en la demostración.

Cálculo secuencial

El cálculo secuencial se desarrolló para estudiar las propiedades de los sistemas de deducción natural. En lugar de trabajar con una fórmula a la vez, utiliza secuencias , que son expresiones de la forma

donde A 1 , ..., A n , B 1 , ..., B k son fórmulas y el símbolo del torniquete se utiliza como puntuación para separar las dos mitades. Intuitivamente, un secuente expresa la idea que implica .

Método tableaux

Una demostración de tabla para la fórmula proposicional ((a ∨ ¬b) ∧ b) → a.

A diferencia de los métodos que se acaban de describir, las derivaciones del método tableaux no son listas de fórmulas. En cambio, una derivación es un árbol de fórmulas. Para mostrar que una fórmula A es demostrable, el método de cuadros intenta demostrar que la negación de A es insatisfactorio. El árbol de la derivación tiene en su raíz; las ramas del árbol de una manera que refleje la estructura de la fórmula. Por ejemplo, demostrar que es insatisfactorio requiere demostrar que C y D son insatisfactorios; esto corresponde a un punto de ramificación en el árbol con padre e hijos C y D.

Resolución

La regla de resolución es una sola regla de inferencia que, junto con la unificación , es sólida y completa para la lógica de primer orden. Al igual que con el método de cuadros, una fórmula se prueba mostrando que la negación de la fórmula es insatisfactorio. La resolución se usa comúnmente en la demostración automatizada de teoremas.

El método de resolución funciona solo con fórmulas que son disyunciones de fórmulas atómicas; Las fórmulas arbitrarias deben convertirse primero a esta forma a través de Skolemization . La regla de resolución establece que a partir de las hipótesis y , se puede obtener la conclusión .

Identidades demostrables

Se pueden probar muchas identidades, que establecen equivalencias entre fórmulas particulares. Estas identidades permiten reorganizar fórmulas moviendo cuantificadores a través de otras conectivas y son útiles para poner fórmulas en forma normal prenex . Algunas identidades probables incluyen:

(donde no debe ocurrir libre en )
(donde no debe ocurrir libre en )

Igualdad y sus axiomas

Hay varias convenciones diferentes para usar la igualdad (o identidad) en la lógica de primer orden. La convención más común, conocida como lógica de primer orden con igualdad , incluye el símbolo de igualdad como símbolo lógico primitivo que siempre se interpreta como la relación de igualdad real entre miembros del dominio del discurso, de modo que los "dos" miembros dados son los mismo miembro. Este enfoque también agrega ciertos axiomas sobre la igualdad al sistema deductivo empleado. Estos axiomas de igualdad son:

  1. Reflexividad . Para cada variable x , x = x .
  2. Sustitución de funciones. Para todas las variables x e y , y cualquier símbolo de la función f ,
    x = yf (..., x , ...) = f (..., y , ...).
  3. Sustitución de fórmulas . Para las variables x e y y cualquier φ fórmula ( x ), si φ' se obtiene mediante la sustitución de cualquier número de ocurrencias libres de x en φ con Y , de manera que éstos permanecen ocurrencias libres de y , a continuación,
    x = y → (φ → φ ').

Estos son esquemas de axiomas , cada uno de los cuales especifica un conjunto infinito de axiomas. El tercer esquema se conoce como ley de Leibniz , "el principio de sustituibilidad", "la indiscernibilidad de los idénticos" o "la propiedad de reemplazo". El segundo esquema, que involucra el símbolo de función f , es (equivalente a) un caso especial del tercer esquema, usando la fórmula

x = y → ( f (..., x , ...) = z → f (..., y , ...) = z).

Muchas otras propiedades de la igualdad son consecuencia de los axiomas anteriores, por ejemplo:

  1. Simetría. Si x = y entonces y = x .
  2. Transitividad. Si x = y y y = z entonces x = z .

Lógica de primer orden sin igualdad

Un enfoque alternativo considera que la relación de igualdad es un símbolo no lógico. Esta convención se conoce como lógica de primer orden sin igualdad . Si se incluye una relación de igualdad en la firma, los axiomas de igualdad ahora deben agregarse a las teorías en consideración, si se desea, en lugar de considerarse reglas de lógica. La principal diferencia entre este método y la lógica de primer orden con igualdad es que una interpretación ahora puede interpretar a dos individuos distintos como "iguales" (aunque, según la ley de Leibniz, estos satisfarán exactamente las mismas fórmulas bajo cualquier interpretación). Es decir, la relación de igualdad ahora puede ser interpretada por una relación de equivalencia arbitraria en el dominio del discurso que es congruente con respecto a las funciones y relaciones de la interpretación.

Cuando se sigue esta segunda convención, el término modelo normal se utiliza para referirse a una interpretación donde no hay individuos distintos a y b satisfacen un = b . En la lógica de primer orden con igualdad, solo se consideran los modelos normales, por lo que no existe un término para un modelo que no sea un modelo normal. Cuando se estudia la lógica de primer orden sin igualdad, es necesario enmendar los enunciados de resultados como el teorema de Löwenheim-Skolem para que solo se consideren modelos normales.

La lógica de primer orden sin igualdad se emplea a menudo en el contexto de la aritmética de segundo orden y otras teorías aritméticas de orden superior, donde la relación de igualdad entre conjuntos de números naturales generalmente se omite.

Definiendo la igualdad dentro de una teoría

Si una teoría tiene una fórmula binaria A ( x , y ) que satisface la reflexividad y la ley de Leibniz, se dice que la teoría tiene igualdad, o que es una teoría con igualdad. Es posible que la teoría no tenga todas las instancias de los esquemas anteriores como axiomas, sino más bien como teoremas derivables. Por ejemplo, en teorías sin símbolos de función y un número finito de relaciones, es posible definir la igualdad en términos de las relaciones, mediante la definición de los dos términos s y t ser iguales si cualquier relación no se modifica cambiando s a t en cualquier argumento.

Algunas teorías permiten otras definiciones ad hoc de igualdad:

  • En la teoría de órdenes parciales con un símbolo de relación ≤, se podría definir s = t como una abreviatura de stts .
  • En la teoría de conjuntos con una relación ∈, se puede definir s = t como una abreviatura de x ( sxtx ) ∧ ∀ x ( xsxt ) . Esta definición de igualdad satisface automáticamente los axiomas de igualdad. En este caso, se debe reemplazar el habitual axioma de extensionalidad , que se puede expresar como , con una formulación alternativa , que dice que si los conjuntos x e y tienen los mismos elementos, entonces ellos también pertenecen a los mismos conjuntos.

Propiedades metalogicas

Una motivación para el uso de la lógica de primer orden, en lugar de la lógica de orden superior , es que la lógica de primer orden tiene muchas propiedades metalógicas que las lógicas más fuertes no tienen. Estos resultados se refieren a propiedades generales de la propia lógica de primer orden, más que a propiedades de teorías individuales. Proporcionan herramientas fundamentales para la construcción de modelos de teorías de primer orden.

Completitud e indecidibilidad

El teorema de completitud de Gödel , probado por Kurt Gödel en 1929, establece que existen sistemas deductivos sólidos, completos y efectivos para la lógica de primer orden y, por lo tanto, la relación de consecuencia lógica de primer orden es capturada por la demostrabilidad finita. Ingenuamente, la afirmación de que una fórmula φ implica lógicamente una fórmula ψ depende de cada modelo de φ; estos modelos serán en general de cardinalidad arbitrariamente grande y, por lo tanto, las consecuencias lógicas no se pueden verificar de manera efectiva verificando todos los modelos. Sin embargo, es posible enumerar todas las derivaciones finitas y buscar una derivación de ψ a partir de φ. Si ψ está lógicamente implícito en φ, eventualmente se encontrará dicha derivación. Por tanto, la consecuencia lógica de primer orden es semidecidible : es posible hacer una enumeración efectiva de todos los pares de oraciones (φ, ψ) de modo que ψ sea una consecuencia lógica de φ.

A diferencia de la lógica proposicional , la lógica de primer orden es indecidible (aunque semidecidible), siempre que el lenguaje tenga al menos un predicado de aridad al menos 2 (distinto de igualdad). Esto significa que no existe un procedimiento de decisión que determine si las fórmulas arbitrarias son lógicamente válidas. Este resultado fue establecido independientemente por Alonzo Church y Alan Turing en 1936 y 1937, respectivamente, dando una respuesta negativa al Entscheidungsproblem planteado por David Hilbert y Wilhelm Ackermann en 1928. Sus pruebas demuestran una conexión entre la imposibilidad de resolver el problema de la decisión por primera vez. la lógica del orden y la imposibilidad de resolver el problema de la detención .

Hay sistemas más débiles que la lógica de primer orden completa para los que la relación de consecuencia lógica es decidible. Estos incluyen la lógica proposicional y la lógica de predicados monádica , que es lógica de primer orden restringida a símbolos de predicado unario y sin símbolos de función. Otras lógicas sin símbolos de función que son decidibles son el fragmento protegido de la lógica de primer orden, así como la lógica de dos variables . La clase Bernays-Schönfinkel de fórmulas de primer orden también es decidible. Los subconjuntos decidibles de la lógica de primer orden también se estudian en el marco de las lógicas descriptivas .

El teorema de Löwenheim-Skolem

El teorema de Löwenheim-Skolem muestra que si una teoría de cardinalidad de primer orden λ tiene un modelo infinito, entonces tiene modelos de cada cardinalidad infinita mayor o igual que λ. Uno de los primeros resultados en la teoría de modelos , implica que no es posible caracterizar la contabilización o incontable en un lenguaje de primer orden con una firma contable. Es decir, no existe una fórmula de primer orden φ ( x ) tal que una estructura arbitraria M satisfaga φ si y solo si el dominio del discurso de M es contable (o, en el segundo caso, incontable).

El teorema de Löwenheim-Skolem implica que las estructuras infinitas no pueden axiomatizarse categóricamente en la lógica de primer orden. Por ejemplo, no existe una teoría de primer orden cuyo único modelo sea la línea real: cualquier teoría de primer orden con un modelo infinito también tiene un modelo de cardinalidad mayor que el continuo. Dado que la línea real es infinita, cualquier teoría satisfecha por la línea real también es satisfecha por algunos modelos no estándar . Cuando el teorema de Löwenheim-Skolem se aplica a las teorías de conjuntos de primer orden, las consecuencias no intuitivas se conocen como paradoja de Skolem .

El teorema de la compacidad

El teorema de la compacidad establece que un conjunto de oraciones de primer orden tiene un modelo si y solo si cada subconjunto finito tiene un modelo. Esto implica que si una fórmula es una consecuencia lógica de un conjunto infinito de axiomas de primer orden, entonces es una consecuencia lógica de algún número finito de esos axiomas. Este teorema fue probado primero por Kurt Gödel como consecuencia del teorema de completitud, pero se han obtenido muchas pruebas adicionales a lo largo del tiempo. Es una herramienta central en la teoría de modelos, proporcionando un método fundamental para construir modelos.

El teorema de la compacidad tiene un efecto limitante sobre qué colecciones de estructuras de primer orden son clases elementales. Por ejemplo, el teorema de la compacidad implica que cualquier teoría que tenga modelos finitos arbitrariamente grandes tiene un modelo infinito. Por tanto, la clase de todos los gráficos finitos no es una clase elemental (lo mismo se aplica a muchas otras estructuras algebraicas).

También hay limitaciones más sutiles de la lógica de primer orden que están implícitas en el teorema de la compacidad. Por ejemplo, en informática, muchas situaciones se pueden modelar como un gráfico dirigido de estados (nodos) y conexiones (bordes dirigidos). La validación de un sistema de este tipo puede requerir demostrar que no se puede alcanzar un estado "malo" desde un estado "bueno". Por lo tanto, se busca determinar si los estados bueno y malo están en diferentes componentes conectados del gráfico. Sin embargo, el teorema de la compacidad se puede utilizar para mostrar que los gráficos conectados no son una clase elemental en la lógica de primer orden, y no existe una fórmula φ ( x , y ) de la lógica de primer orden, en la lógica de los gráficos , que exprese la idea de que existe un camino desde x a y . Sin embargo, la conectividad se puede expresar en lógica de segundo orden , pero no solo con cuantificadores de conjuntos existenciales, ya que también disfruta de la compacidad.

Teorema de Lindström

Per Lindström mostró que las propiedades metalogicas que acabamos de discutir en realidad caracterizan la lógica de primer orden en el sentido de que ninguna lógica más fuerte también puede tener esas propiedades (Ebbinghaus y Flum 1994, Capítulo XIII). Lindström definió una clase de sistemas lógicos abstractos y una definición rigurosa de la fuerza relativa de un miembro de esta clase. Estableció dos teoremas para sistemas de este tipo:

  • Un sistema lógico que satisfaga la definición de Lindström que contenga lógica de primer orden y satisfaga tanto el teorema de Löwenheim-Skolem como el teorema de compacidad debe ser equivalente a la lógica de primer orden.
  • Un sistema lógico que satisfaga la definición de Lindström que tenga una relación de consecuencia lógica semidecidible y satisfaga el teorema de Löwenheim-Skolem debe ser equivalente a la lógica de primer orden.

Limitaciones

Aunque la lógica de primer orden es suficiente para formalizar gran parte de las matemáticas, y se usa comúnmente en ciencias de la computación y otros campos, tiene ciertas limitaciones. Estos incluyen limitaciones en su expresividad y limitaciones de los fragmentos de lenguajes naturales que puede describir.

Por ejemplo, la lógica de primer orden es indecidible, lo que significa que un algoritmo de decisión sólido, completo y final para la demostrabilidad es imposible. Esto ha llevado al estudio de interesantes fragmentos decidibles, como C 2 : lógica de primer orden con dos variables y los cuantificadores de conteo y .

Expresividad

El teorema de Löwenheim-Skolem muestra que si una teoría de primer orden tiene un modelo infinito, entonces tiene modelos infinitos de cada cardinalidad. En particular, ninguna teoría de primer orden con un modelo infinito puede ser categórica . Por tanto, no existe una teoría de primer orden cuyo único modelo tenga el conjunto de números naturales como dominio, o cuyo único modelo tenga el conjunto de números reales como dominio. Muchas extensiones de la lógica de primer orden, incluidas las lógicas infinitarias y las lógicas de orden superior, son más expresivas en el sentido de que permiten axiomatizaciones categóricas de los números naturales o reales. Sin embargo, esta expresividad tiene un costo metalológico: según el teorema de Lindström, el teorema de la compacidad y el teorema descendente de Löwenheim-Skolem no pueden sostenerse en ninguna lógica más fuerte que el primer orden.

Formalización de lenguajes naturales

La lógica de primer orden es capaz de formalizar muchas construcciones cuantificadoras simples en lenguaje natural, como "cada persona que vive en Perth vive en Australia". Pero hay muchas características más complicadas del lenguaje natural que no se pueden expresar en la lógica de primer orden (de un solo orden). "Cualquier sistema lógico que sea apropiado como instrumento para el análisis del lenguaje natural necesita una estructura mucho más rica que la lógica de predicados de primer orden".

Escribe Ejemplo Comentario
Cuantificación sobre propiedades Si Juan está satisfecho de sí mismo, entonces hay al menos una cosa que tiene en común con Pedro. El ejemplo requiere un cuantificador sobre predicados, que no se puede implementar en la lógica de primer orden de un solo orden: Zj → ∃X (Xj∧Xp) .
Cuantificación sobre propiedades Santa Claus tiene todos los atributos de un sádico. El ejemplo requiere cuantificadores sobre predicados, que no se pueden implementar en la lógica de primer orden de un solo orden: ∀X (∀x (Sx → Xx) → Xs) .
Predicado adverbial John camina rápido. El ejemplo no puede analizarse como Wj ∧ Qj ;
Los adverbiales de predicado no son lo mismo que los predicados de segundo orden, como el color.
Adjetivo relativo Jumbo es un pequeño elefante. El ejemplo no puede analizarse como Sj ∧ Ej ;
los adjetivos de predicado no son lo mismo que los predicados de segundo orden como el color.
Modificador adverbial de predicado John camina muy rápido. -
Modificador de adjetivo relativo Jumbo es terriblemente pequeño. Una expresión como "terriblemente", cuando se aplica a un adjetivo relativo como "pequeño", da como resultado un nuevo adjetivo relativo compuesto "terriblemente pequeño".
Preposiciones Mary está sentada junto a John. La preposición "al lado de" cuando se aplica a "Juan" da como resultado el predicado adverbial "al lado de Juan".

Restricciones, extensiones y variaciones

Hay muchas variaciones de lógica de primer orden. Algunos de estos no son esenciales en el sentido de que simplemente cambian la notación sin afectar la semántica. Otros cambian el poder expresivo de manera más significativa, extendiendo la semántica a través de cuantificadores adicionales u otros símbolos lógicos nuevos. Por ejemplo, las lógicas infinitas permiten fórmulas de tamaño infinito y las lógicas modales añaden símbolos de posibilidad y necesidad.

Idiomas restringidos

La lógica de primer orden se puede estudiar en lenguajes con menos símbolos lógicos que los descritos anteriormente.

  • Porque se puede expresar como , y se puede expresar como , cualquiera de los dos cuantificadores y se puede descartar.
  • Dado que se puede expresar como y se puede expresar como , o bien se puede descartar. En otras palabras, es suficiente tener y , o y , como los únicos conectivos lógicos.
  • De manera similar, es suficiente tener solo y como conectivos lógicos, o tener solo el trazo de Sheffer (NAND) o el operador de flecha de Peirce (NOR).
  • Es posible evitar por completo los símbolos de función y los símbolos constantes, reescribiéndolos a través de símbolos de predicado de una manera adecuada. Por ejemplo, en lugar de usar un símbolo constante, se puede usar un predicado (interpretado como ) y reemplazar cada predicado como con . Una función como como será reemplazada de manera similar por un predicado interpretado como . Este cambio requiere agregar axiomas adicionales a la teoría en cuestión, de modo que las interpretaciones de los símbolos predicados utilizados tengan la semántica correcta.

Restricciones como estas son útiles como técnica para reducir el número de reglas de inferencia o esquemas de axiomas en sistemas deductivos, lo que conduce a pruebas más breves de resultados metalógicos. El costo de las restricciones es que se vuelve más difícil expresar enunciados en lenguaje natural en el sistema formal en cuestión, porque los conectivos lógicos usados ​​en los enunciados en lenguaje natural deben ser reemplazados por sus definiciones (más largas) en términos de la colección restringida de conectivos lógicos. De manera similar, las derivaciones en los sistemas limitados pueden ser más largas que las derivaciones en sistemas que incluyen conectivos adicionales. Por lo tanto, existe una compensación entre la facilidad de trabajar dentro del sistema formal y la facilidad de probar resultados sobre el sistema formal.

También es posible restringir las aridades de los símbolos de función y los símbolos de predicado, en teorías suficientemente expresivas. En principio, se puede prescindir por completo de funciones de aridad mayor que 2 y predicados de aridad mayor que 1 en teorías que incluyen una función de emparejamiento . Esta es una función de arity 2 que toma pares de elementos del dominio y devuelve un par ordenado que los contiene. También es suficiente tener dos símbolos predicados de aridad 2 que definan funciones de proyección desde un par ordenado a sus componentes. En cualquier caso, es necesario que se satisfagan los axiomas naturales para una función de emparejamiento y sus proyecciones.

Lógica de muchos ordenamientos

Las interpretaciones ordinarias de primer orden tienen un solo dominio de discurso sobre el que se extienden todos los cuantificadores. La lógica de primer orden de muchos ordenamientos permite que las variables tengan diferentes tipos , que tienen diferentes dominios. Esto también se denomina lógica de primer orden tipificada y los tipos se denominan tipos (como en el tipo de datos ), pero no es lo mismo que la teoría de tipos de primer orden . La lógica de primer orden de muchos ordenamientos se utiliza a menudo en el estudio de la aritmética de segundo orden .

Cuando solo hay un número finito de tipos en una teoría, la lógica de primer orden de muchos ordenamientos se puede reducir a la lógica de primer orden de un solo orden. Se introduce en la teoría de ordenamiento único un símbolo de predicado unario para cada género en la teoría de ordenamiento múltiple, y se agrega un axioma que dice que estos predicados unarios dividen el dominio del discurso. Por ejemplo, si hay dos tipos, uno agrega símbolos de predicado y y el axioma

.

Entonces, los elementos satisfactorios se consideran elementos del primer tipo y los elementos satisfactorios como elementos del segundo tipo. Se puede cuantificar sobre cada tipo utilizando el símbolo de predicado correspondiente para limitar el rango de cuantificación. Por ejemplo, para decir que hay un elemento del primer tipo que satisface la fórmula φ ( x ), se escribe

.

Cuantificadores adicionales

Se pueden agregar cuantificadores adicionales a la lógica de primer orden.

  • A veces es útil decir que " P ( x ) se cumple exactamente para una x ", que se puede expresar como ∃! x P ( x ) . Esta notación, llamada cuantificación de unicidad , se puede tomar para abreviar una fórmula como x ( P ( x ) ∧∀ y ( P ( y ) → ( x = y ))) .
  • La lógica de primer orden con cuantificadores adicionales tiene nuevos cuantificadores Qx , ..., con significados como "hay muchos x tales que ...". Vea también cuantificadores de ramificación y cuantificadores plurales de George Boolos y otros.
  • Los cuantificadores acotados se utilizan a menudo en el estudio de la teoría de conjuntos o la aritmética.

Lógicas infinitas

La lógica infinita permite oraciones infinitamente largas. Por ejemplo, se puede permitir una conjunción o disyunción de un número infinito de fórmulas, o una cuantificación sobre un número infinito de variables. Las oraciones infinitamente largas surgen en áreas de las matemáticas, incluida la topología y la teoría de modelos .

La lógica infinita generaliza la lógica de primer orden para permitir fórmulas de longitud infinita. La forma más común en la que las fórmulas pueden volverse infinitas es a través de conjunciones y disyunciones infinitas. Sin embargo, también es posible admitir firmas generalizadas en las que se permite que los símbolos de función y relación tengan aridades infinitas, o en las que los cuantificadores pueden unir infinitas variables. Debido a que una fórmula infinita no puede ser representada por una cadena finita, es necesario elegir alguna otra representación de fórmulas; la representación habitual en este contexto es un árbol. Por lo tanto, las fórmulas se identifican, esencialmente, con sus árboles de análisis sintáctico, en lugar de con las cadenas que se analizan.

Las lógicas infinitarias más comúnmente estudiadas se denominan L αβ , donde α y β son números cardinales o el símbolo ∞. En esta notación, la lógica ordinaria de primer orden es L ωω . En la lógica L ∞ω , se permiten conjunciones o disyunciones arbitrarias al construir fórmulas, y hay un suministro ilimitado de variables. De manera más general, la lógica que permite conjunciones o disyunciones con menos de κ constituyentes se conoce como L κω . Por ejemplo, L ω 1 ω permite conjunciones y disyunciones contables .

El conjunto de variables libres en una fórmula de L κω puede tener cualquier cardinalidad estrictamente menor que κ, pero solo un número finito de ellas puede estar en el alcance de cualquier cuantificador cuando una fórmula aparece como una subfórmula de otra. En otras lógicas infinitas, una subfórmula puede estar en el alcance de un número infinito de cuantificadores. Por ejemplo, en L κ∞ , un único cuantificador universal o existencial puede unir arbitrariamente muchas variables simultáneamente. De manera similar, la lógica L κλ permite la cuantificación simultánea sobre menos de λ variables, así como conjunciones y disyunciones de tamaño menor que κ.

Lógicas modales y no clásicas

  • La lógica intuicionista de primer orden utiliza el cálculo proposicional intuicionista más que el clásico; por ejemplo, ¬¬φ no necesita ser equivalente a φ.
  • La lógica modal de primer orden permite describir otros mundos posibles, así como este mundo contingentemente verdadero que habitamos. En algunas versiones, el conjunto de mundos posibles varía según el mundo posible en el que se habita. La lógica modal tiene operadores modales extra con significados que pueden caracterizarse informalmente como, por ejemplo, "es necesario que φ" (verdadero en todos los mundos posibles) y "es posible que φ" (verdadero en algún mundo posible). Con la lógica estándar de primer orden tenemos un solo dominio y a cada predicado se le asigna una extensión. Con la lógica modal de primer orden tenemos una función de dominio que asigna a cada mundo posible su propio dominio, de modo que cada predicado obtiene una extensión solo en relación con estos mundos posibles. Esto nos permite modelar casos en los que, por ejemplo, Alex es un filósofo, pero podría haber sido un matemático y podría no haber existido en absoluto. En el primer mundo posible P ( a ) es verdadero, en el segundo P ( a ) es falso, y en el tercer mundo posible no hay a en el dominio en absoluto.
  • Las lógicas difusas de primer orden son extensiones de primer orden de las lógicas difusas proposicionales en lugar del cálculo proposicional clásico.

Lógica de punto fijo

La lógica de punto fijo extiende la lógica de primer orden al agregar el cierre debajo de los puntos menos fijos de los operadores positivos.

Lógicas de orden superior

El rasgo característico de la lógica de primer orden es que los individuos pueden cuantificarse, pero no los predicados. Por lo tanto

es una fórmula legal de primer orden, pero

no lo es, en la mayoría de las formalizaciones de la lógica de primer orden. La lógica de segundo orden amplía la lógica de primer orden al agregar el último tipo de cuantificación. Otras lógicas de orden superior permiten la cuantificación sobre tipos incluso superiores a los que permite la lógica de segundo orden. Estos tipos superiores incluyen relaciones entre relaciones, funciones de relaciones a relaciones entre relaciones y otros objetos de tipo superior. Así, el "primero" en la lógica de primer orden describe el tipo de objetos que se pueden cuantificar.

A diferencia de la lógica de primer orden, para la que solo se estudia una semántica, existen varias semánticas posibles para la lógica de segundo orden. La semántica más comúnmente empleada para la lógica de segundo y orden superior se conoce como semántica completa . La combinación de cuantificadores adicionales y la semántica completa de estos cuantificadores hace que la lógica de orden superior sea más fuerte que la lógica de primer orden. En particular, la relación de consecuencia lógica (semántica) para la lógica de segundo orden y la lógica de orden superior no es semidecidible; No existe un sistema de deducción eficaz para la lógica de segundo orden que sea sólido y completo bajo una semántica completa.

La lógica de segundo orden con semántica completa es más expresiva que la lógica de primer orden. Por ejemplo, es posible crear sistemas de axiomas en lógica de segundo orden que caractericen de manera única los números naturales y la línea real. El costo de esta expresividad es que las lógicas de segundo orden y de orden superior tienen menos propiedades metálicas atractivas que la lógica de primer orden. Por ejemplo, el teorema de Löwenheim-Skolem y el teorema de compacidad de la lógica de primer orden se vuelven falsos cuando se generalizan a lógicas de orden superior con semántica completa.

Demostración automatizada de teoremas y métodos formales

La demostración automatizada de teoremas se refiere al desarrollo de programas de computadora que buscan y encuentran derivaciones (demostraciones formales) de teoremas matemáticos. Encontrar derivaciones es una tarea difícil porque el espacio de búsqueda puede ser muy grande; una búsqueda exhaustiva de todas las posibles derivaciones es teóricamente posible pero computacionalmente inviable para muchos sistemas de interés en matemáticas. Por tanto , se desarrollan funciones heurísticas complicadas para intentar encontrar una derivación en menos tiempo que una búsqueda ciega.

El área relacionada de verificación de pruebas automatizada utiliza programas de computadora para verificar que las pruebas creadas por humanos sean correctas. A diferencia de los complicados probadores de teoremas automatizados, los sistemas de verificación pueden ser lo suficientemente pequeños como para que se pueda comprobar su exactitud tanto a mano como mediante la verificación automática del software. Esta validación del verificador de pruebas es necesaria para dar confianza en que cualquier derivación etiquetada como "correcta" es realmente correcta.

Algunos verificadores de pruebas, como Metamath , insisten en tener una derivación completa como entrada. Otros, como Mizar e Isabelle , toman un boceto de prueba bien formateado (que aún puede ser muy largo y detallado) y completan las piezas faltantes haciendo búsquedas de prueba simples o aplicando procedimientos de decisión conocidos: la derivación resultante es luego verificada por un "núcleo" de núcleo pequeño. Muchos de estos sistemas están destinados principalmente a un uso interactivo por parte de matemáticos humanos: estos se conocen como asistentes de prueba . También pueden usar lógicas formales que son más fuertes que la lógica de primer orden, como la teoría de tipos. Debido a que una derivación completa de cualquier resultado no trivial en un sistema deductivo de primer orden será extremadamente larga para que la escriba un humano, los resultados a menudo se formalizan como una serie de lemas, para los cuales las derivaciones se pueden construir por separado.

Los probadores de teoremas automatizados también se utilizan para implementar la verificación formal en informática. En este contexto, los probadores de teoremas se utilizan para verificar la corrección de los programas y del hardware, como los procesadores, con respecto a una especificación formal . Debido a que dicho análisis requiere mucho tiempo y, por lo tanto, es costoso, generalmente se reserva para proyectos en los que un mal funcionamiento tendría graves consecuencias humanas o financieras.

Para el problema de la verificación del modelo , se sabe que los algoritmos eficientes deciden si una estructura finita de entrada satisface una fórmula de primer orden, además de los límites de complejidad computacional : ver Verificación de modelos § Lógica de primer orden .

Ver también

Notas

Referencias

enlaces externos