Interface OllamaInput

interface OllamaInput {
    baseUrl?: string;
    cache?: boolean | BaseCache<Generation[]>;
    callbackManager?: CallbackManager;
    callbacks?: Callbacks;
    concurrency?: number;
    embeddingOnly?: boolean;
    f16Kv?: boolean;
    fetch?: {
        (input: RequestInfo | URL, init?: RequestInit): Promise<Response>;
        (input: string | Request | URL, init?: RequestInit): Promise<Response>;
    };
    format?: string;
    frequencyPenalty?: number;
    headers?: Record<string, string> | Headers;
    keepAlive?: string | number;
    logitsAll?: boolean;
    lowVram?: boolean;
    mainGpu?: number;
    maxConcurrency?: number;
    maxRetries?: number;
    metadata?: Record<string, unknown>;
    mirostat?: number;
    mirostatEta?: number;
    mirostatTau?: number;
    model?: string;
    numBatch?: number;
    numCtx?: number;
    numGpu?: number;
    numKeep?: number;
    numPredict?: number;
    numThread?: number;
    numa?: boolean;
    onFailedAttempt?: FailedAttemptHandler;
    penalizeNewline?: boolean;
    presencePenalty?: number;
    repeatLastN?: number;
    repeatPenalty?: number;
    seed?: number;
    stop?: string[];
    tags?: string[];
    temperature?: number;
    tfsZ?: number;
    topK?: number;
    topP?: number;
    typicalP?: number;
    useMlock?: boolean;
    useMmap?: boolean;
    verbose?: boolean;
    vocabOnly?: boolean;
}

Hierarchy (view full)

BaseLLMParams
OllamaCamelCaseOptions
- OllamaInput

Implemented by

Ollama

Properties

`Optional`baseUrl

baseUrl?: string

Optionally override the base URL to make request to. This should only be set if your Ollama instance is being server from a non-standard location.

Default

"http://localhost:11434"

`Optional`cache

cache?: boolean | BaseCache<Generation[]>

`Optional`callbackManager

callbackManager?: CallbackManager

Deprecated

Use callbacks instead

`Optional`callbacks

callbacks?: Callbacks

`Optional`concurrency

concurrency?: number

Deprecated

Use maxConcurrency instead

`Optional`embeddingOnly

embeddingOnly?: boolean

`Optional`f16Kv

f16Kv?: boolean

`Optional`fetch

fetch?: {
(input: RequestInfo | URL, init?: RequestInit): Promise<Response>;
(input: string | Request | URL, init?: RequestInit): Promise<Response>;
}

The fetch function to use.

Type declaration

- (input, init?): Promise<Response>
- MDN Reference
  Parameters
  - input: RequestInfo | URL
  - Optionalinit: RequestInit
  Returns Promise<Response>
- (input, init?): Promise<Response>
- Parameters
  - input: string | Request | URL
  - Optionalinit: RequestInit
  Returns Promise<Response>

Default

fetch

`Optional`format

format?: string

`Optional`frequencyPenalty

frequencyPenalty?: number

`Optional`headers

headers?: Record<string, string> | Headers

Optional HTTP Headers to include in the request.

`Optional`keepAlive

keepAlive?: string | number

Default

"5m"

`Optional`logitsAll

logitsAll?: boolean

`Optional`lowVram

lowVram?: boolean

`Optional`mainGpu

mainGpu?: number

`Optional`maxConcurrency

maxConcurrency?: number

The maximum number of concurrent calls that can be made. Defaults to Infinity, which means no limit.

`Optional`maxRetries

maxRetries?: number

The maximum number of retries that can be made for a single call, with an exponential backoff between each attempt. Defaults to 6.

`Optional`metadata

metadata?: Record<string, unknown>

`Optional`mirostat

mirostat?: number

`Optional`mirostatEta

mirostatEta?: number

`Optional`mirostatTau

mirostatTau?: number

`Optional`model

model?: string

The model to use when making requests.

Default

"llama3"

`Optional`numBatch

numBatch?: number

`Optional`numCtx

numCtx?: number

`Optional`numGpu

numGpu?: number

`Optional`numKeep

numKeep?: number

`Optional`numPredict

numPredict?: number

`Optional`numThread

numThread?: number

`Optional`numa

numa?: boolean

`Optional`onFailedAttempt

onFailedAttempt?: FailedAttemptHandler

Custom handler to handle failed attempts. Takes the originally thrown error object as input, and should itself throw an error if the input error is not retryable.

`Optional`penalizeNewline

penalizeNewline?: boolean

`Optional`presencePenalty

presencePenalty?: number

`Optional`repeatLastN

repeatLastN?: number

`Optional`repeatPenalty

repeatPenalty?: number

`Optional`seed

seed?: number

`Optional`stop

stop?: string[]

`Optional`tags

tags?: string[]

`Optional`temperature

temperature?: number

`Optional`tfsZ

tfsZ?: number

`Optional`topK

topK?: number

`Optional`topP

topP?: number

`Optional`typicalP

typicalP?: number

`Optional`useMlock

useMlock?: boolean

`Optional`useMmap

useMmap?: boolean

`Optional`verbose

verbose?: boolean

`Optional`vocabOnly

vocabOnly?: boolean

Interface OllamaInput

Hierarchy (view full)

Implemented by

Index

Properties

Properties

OptionalbaseUrl

Default

Optionalcache

OptionalcallbackManager

Deprecated

Optionalcallbacks

Optionalconcurrency

Deprecated

OptionalembeddingOnly

Optionalf16Kv

Optionalfetch

Type declaration

Parameters

Returns Promise<Response>

Parameters

Returns Promise<Response>

Default

Optionalformat

OptionalfrequencyPenalty

Optionalheaders

OptionalkeepAlive

Default

OptionallogitsAll

OptionallowVram

OptionalmainGpu

OptionalmaxConcurrency

OptionalmaxRetries

Optionalmetadata

Optionalmirostat

OptionalmirostatEta

OptionalmirostatTau

Optionalmodel

Default

OptionalnumBatch

OptionalnumCtx

OptionalnumGpu

OptionalnumKeep

OptionalnumPredict

OptionalnumThread

Optionalnuma

OptionalonFailedAttempt

OptionalpenalizeNewline

OptionalpresencePenalty

OptionalrepeatLastN

OptionalrepeatPenalty

Optionalseed

Optionalstop

Optionaltags

Optionaltemperature

OptionaltfsZ

OptionaltopK

OptionaltopP

OptionaltypicalP

OptionaluseMlock

OptionaluseMmap

Optionalverbose

OptionalvocabOnly

Settings

On This Page

`Optional`baseUrl

`Optional`cache

`Optional`callbackManager

`Optional`callbacks

`Optional`concurrency

`Optional`embeddingOnly

`Optional`f16Kv

`Optional`fetch

`Optional`format

`Optional`frequencyPenalty

`Optional`headers

`Optional`keepAlive

`Optional`logitsAll

`Optional`lowVram

`Optional`mainGpu

`Optional`maxConcurrency

`Optional`maxRetries

`Optional`metadata

`Optional`mirostat

`Optional`mirostatEta

`Optional`mirostatTau

`Optional`model

`Optional`numBatch

`Optional`numCtx

`Optional`numGpu

`Optional`numKeep

`Optional`numPredict

`Optional`numThread

`Optional`numa

`Optional`onFailedAttempt

`Optional`penalizeNewline

`Optional`presencePenalty

`Optional`repeatLastN

`Optional`repeatPenalty

`Optional`seed

`Optional`stop

`Optional`tags

`Optional`temperature

`Optional`tfsZ

`Optional`topK

`Optional`topP

`Optional`typicalP

`Optional`useMlock

`Optional`useMmap

`Optional`verbose

`Optional`vocabOnly