Interface GradientLLMParams

The GradientLLMParams interface defines the input parameters for the GradientLLM class.

interface GradientLLMParams {
    adapterId?: string;
    cache?: boolean | BaseCache<Generation[]>;
    callbackManager?: CallbackManager;
    callbacks?: Callbacks;
    concurrency?: number;
    gradientAccessKey?: string;
    inferenceParameters?: Record<string, unknown>;
    maxConcurrency?: number;
    maxRetries?: number;
    metadata?: Record<string, unknown>;
    modelSlug?: string;
    onFailedAttempt?: FailedAttemptHandler;
    tags?: string[];
    verbose?: boolean;
    workspaceId?: string;
}

Hierarchy

BaseLLMParams
- GradientLLMParams

Index

Properties

adapterId? cache? callbackManager? callbacks? concurrency? gradientAccessKey? inferenceParameters? maxConcurrency? maxRetries? metadata? modelSlug? onFailedAttempt? tags? verbose? workspaceId?

Properties

`Optional`adapterId

adapterId?: string

Gradient Adapter ID for custom fine tuned models.

`Optional`cache

cache?: boolean | BaseCache<Generation[]>

`Optional`callbackManager

callbackManager?: CallbackManager

Deprecated

Use callbacks instead

`Optional`callbacks

callbacks?: Callbacks

`Optional`concurrency

concurrency?: number

Deprecated

Use maxConcurrency instead

`Optional`gradientAccessKey

gradientAccessKey?: string

Gradient AI Access Token. Provide Access Token if you do not wish to automatically pull from env.

`Optional`inferenceParameters

inferenceParameters?: Record<string, unknown>

Parameters accepted by the Gradient npm package.

`Optional`maxConcurrency

maxConcurrency?: number

The maximum number of concurrent calls that can be made. Defaults to Infinity, which means no limit.

`Optional`maxRetries

maxRetries?: number

The maximum number of retries that can be made for a single call, with an exponential backoff between each attempt. Defaults to 6.

`Optional`metadata

metadata?: Record<string, unknown>

`Optional`modelSlug

modelSlug?: string

Gradient AI Model Slug.

`Optional`onFailedAttempt

onFailedAttempt?: FailedAttemptHandler

Custom handler to handle failed attempts. Takes the originally thrown error object as input, and should itself throw an error if the input error is not retryable.

`Optional`tags

tags?: string[]

`Optional`verbose

verbose?: boolean

`Optional`workspaceId

workspaceId?: string

Gradient Workspace Id. Provide workspace id if you do not wish to automatically pull from env.

Interface GradientLLMParams

Hierarchy

Index

Properties

Properties

`Optional`adapterId

`Optional`cache

`Optional`callbackManager

Deprecated

`Optional`callbacks

`Optional`concurrency

Deprecated

`Optional`gradientAccessKey

`Optional`inferenceParameters

`Optional`maxConcurrency

`Optional`maxRetries

`Optional`metadata

`Optional`modelSlug

`Optional`onFailedAttempt

`Optional`tags

`Optional`verbose

`Optional`workspaceId

Settings

On This Page

Interface GradientLLMParams

Hierarchy

Index

Properties

Properties

OptionaladapterId

Optionalcache

OptionalcallbackManager

Deprecated

Optionalcallbacks

Optionalconcurrency

Deprecated

OptionalgradientAccessKey

OptionalinferenceParameters

OptionalmaxConcurrency

OptionalmaxRetries

Optionalmetadata

OptionalmodelSlug

OptionalonFailedAttempt

Optionaltags

Optionalverbose

OptionalworkspaceId

Settings

On This Page

`Optional`adapterId

`Optional`cache

`Optional`callbackManager

`Optional`callbacks

`Optional`concurrency

`Optional`gradientAccessKey

`Optional`inferenceParameters

`Optional`maxConcurrency

`Optional`maxRetries

`Optional`metadata

`Optional`modelSlug

`Optional`onFailedAttempt

`Optional`tags

`Optional`verbose

`Optional`workspaceId