from egglog import (
    EGraph,
    Expr,
    String,
    StringLike,
    function,
    rewrite,
    rule,
    ruleset,
    union,
)
from sealir import grammar, rvsdg
from sealir.eqsat import rvsdg_eqsat
from sealir.eqsat.py_eqsat import Py_AddIO
from sealir.eqsat.rvsdg_convert import egraph_conversion
from sealir.eqsat.rvsdg_eqsat import GraphRoot, PortList, Region, Term
from sealir.eqsat.rvsdg_extract import (
    CostModel,
    EGraphToRVSDG,
    egraph_extraction,
)
from sealir.llvm_pyapi_backend import SSAValue

from ch02_egraph_basic import (
    BackendOutput,
    EGraphExtractionOutput,
    backend,
    jit_compile,
    pipeline_egraph_extraction,
)
from ch03_egraph_program_rewrites import (
    compiler_pipeline as _ch03_compiler_pipeline,
)
from ch03_egraph_program_rewrites import (
    ruleset_const_propagate,
    run_test,
)
from utils import IN_NOTEBOOK, Report, display

def pipeline_egraph_extraction(
    egraph,
    rvsdg_expr,
    converter_class,
    cost_model,
    pipeline_report=Report.Sink(),
) -> EGraphExtractionOutput:
    with pipeline_report.nest(
        "EGraph Extraction", default_expanded=True
    ) as report:
        cost, extracted = egraph_extraction(
            egraph,
            rvsdg_expr,
            converter_class=converter_class,  # <---- new
            cost_model=cost_model,  # <-------------- new
        )
        report.append("Cost", cost)
        report.append("Extracted", rvsdg.format_rvsdg(extracted))
        return {"cost": cost, "extracted": extracted}

pipeline_new_extract = _ch03_compiler_pipeline.replace(
    "pipeline_egraph_extraction", pipeline_egraph_extraction
)

def extended_backend(
    extracted, codegen_extension, pipeline_report=Report.Sink()
) -> BackendOutput:
    with pipeline_report.nest("Backend", default_expanded=True) as report:
        llmod = backend(extracted, codegen_extension=codegen_extension)
        report.append("LLVM", llmod)
        jt = jit_compile(llmod, extracted)
        return {"jit_func": jt, "llmod": llmod}

# extend the pipeline with the new backend
pipeline_backend = pipeline_new_extract.replace(
    "pipeline_backend", extended_backend
)
compiler_pipeline = pipeline_backend

# visualize the pipeline
if __name__ == "__main__":
    display(compiler_pipeline.visualize())

def add_x_y(x, y):
    return x + y

basic_ruleset = rvsdg_eqsat.ruleset_rvsdg_basic | ruleset_const_propagate

if __name__ == "__main__":
    # start with previous compiler pipeline
    report = Report("Compiler Pipeline", default_expanded=True)
    jt = compiler_pipeline(
        fn=add_x_y,
        ruleset=basic_ruleset,
        converter_class=EGraphToRVSDG,
        codegen_extension=None,
        cost_model=None,
        pipeline_report=report,
    ).jit_func
    report.display()
    run_test(add_x_y, jt, (123, 321), verbose=True)

--------------------------------original source---------------------------------
   1|def add_x_y(x, y):
   2|    return x + y
----------------------------------inter source----------------------------------
   1|def transformed_add_x_y(x, y):
   2|    """#file: /tmp/ipykernel_3518/1710880194.py"""
   3|    '#loc: 2:8-2:20'
   4|    return x + y

transformed_add_x_y = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[239] <- !io x y
{
  $1 = PyBinOp + $0[0] $0[1], $0[2]
} [314] -> !io=$1[0] !ret=$1[1]

84347.0

transformed_add_x_y = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[401] <- !io x y
{
  $1 = PyBinOp + $0[0] $0[1], $0[2]
} [450] -> !io=$1[0] !ret=$1[1]

; ModuleID = ""
target triple = "unknown-unknown-unknown"
target datalayout = ""

define ptr @"foo"(ptr %".1", ptr %".2")
{
.4:
  %".5" = alloca ptr
  store ptr null, ptr %".5"
  br label %".7"
.7:
  br label %".9"
.9:
  %".11" = call ptr @"PyNumber_Add"(ptr %".1", ptr %".2")
  ret ptr %".11"
}

declare ptr @"PyNumber_Add"(ptr %".1", ptr %".2")

(123, 321)

444

444

class Type(Expr):
    def __init__(self, name: StringLike): ...

@function
def TypeOf(x: Term) -> Type: ...

@function
def Nb_Unbox_Int64(val: Term) -> Term: ...
@function
def Nb_Box_Int64(val: Term) -> Term: ...
@function
def Nb_Unboxed_Add_Int64(lhs: Term, rhs: Term) -> Term: ...

TypeInt64 = Type("Int64")


@ruleset
def ruleset_type_infer_add(io: Term, x: Term, y: Term, add: Term):
    yield rule(
        add == Py_AddIO(io, x, y),
        TypeOf(x) == TypeInt64,
        TypeOf(y) == TypeInt64,
    ).then(
        # convert to a typed operation
        union(add.getPort(1)).with_(
            Nb_Box_Int64(
                Nb_Unboxed_Add_Int64(Nb_Unbox_Int64(x), Nb_Unbox_Int64(y))
            )
        ),
        # shortcut io
        union(add.getPort(0)).with_(io),
        # output type
        union(TypeOf(add.getPort(1))).with_(TypeInt64),
    )

@ruleset
def facts_argument_types(
    outports: PortList,
    func_uid: String,
    fname: String,
    region: Region,
    arg_x: Term,
    arg_y: Term,
):
    yield rule(
        GraphRoot(
            Term.Func(
                body=Term.RegionEnd(region=region, ports=outports),
                uid=func_uid,
                fname=fname,
            )
        ),
        arg_x == region.get(1),
        arg_y == region.get(2),
    ).then(
        union(TypeOf(arg_x)).with_(TypeInt64),
        union(TypeOf(arg_y)).with_(TypeInt64),
    )

SExpr = rvsdg.grammar.SExpr


class NbOp_Base(grammar.Rule):
    pass


class NbOp_Unboxed_Add_Int64(NbOp_Base):
    lhs: SExpr
    rhs: SExpr


class NbOp_Unbox_Int64(NbOp_Base):
    val: SExpr


class NbOp_Box_Int64(NbOp_Base):
    val: SExpr

class Grammar(grammar.Grammar):
    start = rvsdg.Grammar.start | NbOp_Base

class ExtendEGraphToRVSDG(EGraphToRVSDG):
    grammar = Grammar

    def handle_Term(self, op: str, children: dict | list, grm: Grammar):
        match op, children:
            case "Nb_Unboxed_Add_Int64", {"lhs": lhs, "rhs": rhs}:
                return grm.write(NbOp_Unboxed_Add_Int64(lhs=lhs, rhs=rhs))
            case "Nb_Unbox_Int64", {"val": val}:
                return grm.write(NbOp_Unbox_Int64(val=val))
            case "Nb_Box_Int64", {"val": val}:
                return grm.write(NbOp_Box_Int64(val=val))
            case _:
                # Use parent's implementation for other terms.
                return super().handle_Term(op, children, grm)

def codegen_extension(expr, args, builder, pyapi):
    match expr._head, args:
        case "NbOp_Unboxed_Add_Int64", (lhs, rhs):
            return SSAValue(builder.add(lhs.value, rhs.value))
        case "NbOp_Unbox_Int64", (val,):
            return SSAValue(pyapi.long_as_longlong(val.value))
        case "NbOp_Box_Int64", (val,):
            return SSAValue(pyapi.long_from_longlong(val.value))
    return NotImplemented

class MyCostModel(CostModel):
    def get_cost_function(self, nodename, op, ty, cost, children):
        self_cost = None
        match op:
            case "Nb_Unboxed_Add_Int64":
                self_cost = 0.1

            case "Nb_Unbox_Int64":
                self_cost = 0.1

            case "Nb_Box_Int64":
                self_cost = 0.1

        if self_cost is not None:
            return self.get_simple(self_cost)

        # Fallthrough to parent's cost function
        return super().get_cost_function(nodename, op, ty, cost, children)

typeinfer_ruleset = (
    basic_ruleset | ruleset_type_infer_add | facts_argument_types
)

if __name__ == "__main__":
    report = Report("Compiler Pipeline", default_expanded=True)
    jt = compiler_pipeline(
        fn=add_x_y,
        ruleset=typeinfer_ruleset,
        converter_class=ExtendEGraphToRVSDG,
        codegen_extension=codegen_extension,
        cost_model=MyCostModel(),
        pipeline_report=report,
    ).jit_func
    report.display()
    run_test(add_x_y, jt, (123, 321), verbose=True)

--------------------------------original source---------------------------------
   1|def add_x_y(x, y):
   2|    return x + y
----------------------------------inter source----------------------------------
   1|def transformed_add_x_y(x, y):
   2|    """#file: /tmp/ipykernel_3518/1710880194.py"""
   3|    '#loc: 2:8-2:20'
   4|    return x + y

transformed_add_x_y = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[239] <- !io x y
{
  $1 = PyBinOp + $0[0] $0[1], $0[2]
} [314] -> !io=$1[0] !ret=$1[1]

10964.6

transformed_add_x_y = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[401] <- !io x y
{
  $1 = NbOp_Unbox_Int64 $0[1]
  $2 = NbOp_Unbox_Int64 $0[2]
  $3 = NbOp_Unboxed_Add_Int64 $1 $2
  $4 = NbOp_Box_Int64 $3
} [450] -> !io=$0[0] !ret=$4

; ModuleID = ""
target triple = "unknown-unknown-unknown"
target datalayout = ""

define ptr @"foo"(ptr %".1", ptr %".2")
{
.4:
  %".5" = alloca ptr
  store ptr null, ptr %".5"
  br label %".7"
.7:
  br label %".9"
.9:
  %".11" = call i64 @"PyLong_AsLongLong"(ptr %".1")
  %".12" = call i64 @"PyLong_AsLongLong"(ptr %".2")
  %".13" = add i64 %".11", %".12"
  %".14" = call ptr @"PyLong_FromLongLong"(i64 %".13")
  ret ptr %".14"
}

declare i64 @"PyLong_AsLongLong"(ptr %".1")

declare ptr @"PyLong_FromLongLong"(i64 %".1")

(123, 321)

444

444

def chained_additions(x, y):
    return x + y + y

if __name__ == "__main__":
    report = Report("Compiler Pipeline", default_expanded=True)
    jt = compiler_pipeline(
        fn=chained_additions,
        ruleset=typeinfer_ruleset,
        converter_class=ExtendEGraphToRVSDG,
        codegen_extension=codegen_extension,
        cost_model=MyCostModel(),
    ).jit_func
    report.display()
    run_test(chained_additions, jt, (123, 321), verbose=True)

(123, 321)

765

765

@ruleset
def ruleset_optimize_boxing(x: Term):
    yield rewrite(Nb_Box_Int64(Nb_Unbox_Int64(x)), subsume=True).to(x)
    yield rewrite(Nb_Unbox_Int64(Nb_Box_Int64(x)), subsume=True).to(x)

optimized_ruleset = typeinfer_ruleset | ruleset_optimize_boxing

if __name__ == "__main__":
    report = Report("Compiler Pipeline", default_expanded=True)
    jt = compiler_pipeline(
        fn=chained_additions,
        ruleset=optimized_ruleset,
        converter_class=ExtendEGraphToRVSDG,
        codegen_extension=codegen_extension,
        cost_model=MyCostModel(),
        pipeline_report=report,
    ).jit_func
    report.display()
    run_test(chained_additions, jt, (123, 321), verbose=True)

--------------------------------original source---------------------------------
   1|def chained_additions(x, y):
   2|    return x + y + y
----------------------------------inter source----------------------------------
   1|def transformed_chained_additions(x, y):
   2|    """#file: /tmp/ipykernel_3518/3462865332.py"""
   3|    '#loc: 2:8-2:24'
   4|    return x + y + y

transformed_chained_additions = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[266] <- !io x y
{
  $1 = PyBinOp + $0[0] $0[1], $0[2]
  $2 = PyBinOp + $1[0] $1[1], $0[2]
} [358] -> !io=$2[0] !ret=$2[1]

10971.0

transformed_chained_additions = Func (Args (ArgSpec 'x' (PyNone)) (ArgSpec 'y' (PyNone)))
$0 = Region[457] <- !io x y
{
  $1 = NbOp_Unbox_Int64 $0[1]
  $2 = NbOp_Unbox_Int64 $0[2]
  $3 = NbOp_Unboxed_Add_Int64 $1 $2
  $4 = NbOp_Unboxed_Add_Int64 $3 $2
  $5 = NbOp_Box_Int64 $4
} [511] -> !io=$0[0] !ret=$5

; ModuleID = ""
target triple = "unknown-unknown-unknown"
target datalayout = ""

define ptr @"foo"(ptr %".1", ptr %".2")
{
.4:
  %".5" = alloca ptr
  store ptr null, ptr %".5"
  br label %".7"
.7:
  br label %".9"
.9:
  %".11" = call i64 @"PyLong_AsLongLong"(ptr %".1")
  %".12" = call i64 @"PyLong_AsLongLong"(ptr %".2")
  %".13" = add i64 %".11", %".12"
  %".14" = add i64 %".13", %".12"
  %".15" = call ptr @"PyLong_FromLongLong"(i64 %".14")
  ret ptr %".15"
}

declare i64 @"PyLong_AsLongLong"(ptr %".1")

declare ptr @"PyLong_FromLongLong"(i64 %".1")

(123, 321)

765

765

Chapter 4 Part 0: Type Inference Prelude¶

Imports and Setup¶

A Simple Type Inference Example¶

Adding type inference¶

Defining conversion into RVSDG¶

Optimize boxing logic¶

Box/Unbox optimization rules¶